生生不息

生生不息

R报错-导入中文数据时invalid multibyte string at ''

11
2024-10-02
R报错-导入中文数据时invalid multibyte string at ''

背景

最近在做一个文本分析的作业,需要导入中文,但是导入的时候遇到了如下的错误,直接是无法读取,甚至连乱码的机会都不给我。

8.png

解决方案

查了一会发现是文件的问题,因为我的R已经是调过格式的了,所以系统应该是没有问题的哈~

主要原因是之前导入的csv的格式是(.csv),但事实上只要把文件重新导出成CSV UTF-8(逗号分隔)(.csv)就可以了~

我是直接在Excel里面另存为滴~Excel是可以打开csv滴

报错的是前面打了勾勾的那个格式,改成蓝标的这个就可以了~

9.png

当然有的小伙伴的电脑excel版本可能没有这个选项。没事,我们借用记事本一样可以修改。

具体步骤如下:

将CSV格式文件在记事本中打开

选择另存为,同时将“编码(E)"选择为 UTF-8

点 保存(S),就达到目的了。

结果展示

10.png