本文介绍了如何在R中将国际(立陶宛语)字符转换为相应的HTML代码?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

是否可以从文本文件中读取文本并将Latin-4(ISO / IEC 8859-4)或Latin-6(ISO / IEC 8859-10)字符转换为相应的HTML代码(以及反之亦然)(例如R和RStudio) ±& 261;

Is there a way to read text from a text file and convert Latin-4 (ISO/IEC 8859-4) or Latin-6 (ISO/IEC 8859-10) characters to the correspondent HTML code (and vice versa) in R and RStudio, e.g. ą to &261;?

我对以下符号进行编码解码很感兴趣:ĄąČčĘęĖėĮįššŲųŪūŽž
我打算为此任务使用正则表达式,但是第一个问题是我的RStudio甚至无法正确读取符号:

In particular I'm interested in coding-decoding these symbols: Ąą Čč Ęę Ėė Įį Šš Ųų Ūū Žž.I was intending to use regular expressions for this task, but the first problem is that my RStudio does not even read the symbols correctly:

c("Ąą Čč Ęę Ėė Įį Šš Ųų Ūū Žž")

结果为:

 [1] "Aa Cc Ee Ee Ii  Uu Uu ˇ˛"


推荐答案

最好的 R 包是使用非ASCII语言环境读取的内容。来自Hadley Wickham的。

Well, the best R package to read something with non-ASCII locales is readr from Hadley Wickham.

您可以从安装并检查其是否支持Latin-6

You could install it from here and check if it supports Latin-6

这篇关于如何在R中将国际(立陶宛语)字符转换为相应的HTML代码?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!

10-29 08:25