我正在编写一个Java应用程序,该应用程序需要在纯文本中指定行号和列号的情况下以字节为单位获取字符偏移量。我想知道是否有现有的库可以执行此操作,因为我不想重新发明轮子。
谢谢!
最佳答案
以字节为单位的字符偏移量是非常奇怪的野兽。您想要字符还是字节?这是编码问题。对于UTF-8,甚至会因字符不同而有所不同(对于a
是一个字节,对于ä
是两个字节)。仅使用ASCII可以确保您的安全,但您不必这样说。
如果您确实使用UTF-8,则必须从头开始读取整个文件以执行这种计算。我不知道具有特定功能的库,但是使用适当的InputStreamReader
在Java中也很容易做到。