问题描述
是否可以从文本文件中读取文本并将Latin-4(ISO / IEC 8859-4)或Latin-6(ISO / IEC 8859-10)字符转换为相应的HTML代码(以及反之亦然)(例如R和RStudio) ±
到& 261;
?
Is there a way to read text from a text file and convert Latin-4 (ISO/IEC 8859-4) or Latin-6 (ISO/IEC 8859-10) characters to the correspondent HTML code (and vice versa) in R and RStudio, e.g. ą
to &261;
?
我对以下符号进行编码解码很感兴趣:ĄąČčĘęĖėĮįššŲųŪūŽž。
我打算为此任务使用正则表达式,但是第一个问题是我的RStudio甚至无法正确读取符号:
In particular I'm interested in coding-decoding these symbols: Ąą Čč Ęę Ėė Įį Šš Ųų Ūū Žž.I was intending to use regular expressions for this task, but the first problem is that my RStudio does not even read the symbols correctly:
c("Ąą Čč Ęę Ėė Įį Šš Ųų Ūū Žž")
结果为:
[1] "Aa Cc Ee Ee Ii Uu Uu ˇ˛"
推荐答案
最好的 R 包是使用非ASCII语言环境读取的内容。来自Hadley Wickham的。
Well, the best R package to read something with non-ASCII locales is readr from Hadley Wickham.
您可以从安装并检查其是否支持Latin-6
You could install it from here and check if it supports Latin-6
这篇关于如何在R中将国际(立陶宛语)字符转换为相应的HTML代码?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!