发新话题
打印

[征苦力] 征求人民日报网络资料整理员

TOP

看了一下,有个小问题。就是里面的·都变成了?

比如
本?赫达总理宣布阿法谈判达成协议全线停火(1962.03.20)
应该是
本·赫达总理宣布阿法谈判达成协议全线停火(1962.03.20)

这个是转换时的编码问题。但是想简单的说这样解决吧,把?替换成·,我想也不是很好。因为有的时候原文那里可能人家正好是?  这个我也没仔细研究过,到底原始文件里的是不是全是中文问号?

我的办法就是先把wps直接另存为html网页,然后打开该网页,再另存为txt文本,选择默认的简体中文GB2312编码,经过这种中间转换就可以避免上述的问题。

当然,更简单的是保存的时候就直接复制文字到txt上去,而不是保存到wps。不过这种情况比较适合自己收集、自己整理,自己清楚怎么分类。

[ 本帖最后由 柴荣 于 2007-5-25 10:14 编辑 ]

TOP

明白了。直接复制到txt。下次吧。原本删除了。

TOP

那个实际上也无太大必要。实际上,复制到wps上,后期处理起来,也并不比复制到txt费多少事。

因为你如果要分类拟定小标题的话,加粗标题了,通过搜索代码,别人很容易寻找到加粗的标题。

如果复制到txt上,就没法了。所以如果复制到txt上,就最好一类归到一个文件上,这样有几个标题就分成几分文件,比较好处理。

TOP

引用:
原帖由 柴荣 于 2007-5-25 10:11 发表
我的办法就是先把wps直接另存为html网页,然后打开该网页,再另存为txt文本,选择默认的简体中文GB2312编码,经过这种中间转换就可以避免上述的问题。
了解了。

TOP

TOP

一个小问题。有些报道题目就一个 “简明新闻”或者类似的,光看题目完全不知道里面说了什么。最好整理的时候,顺便把文章就是主题,往往就是第一句话,写上去。这样,一个举手之劳,后人省了好多事。

TOP

OK。

TOP

红海风雨:也门资本主义的家常闲事

http://shaoniu.gbaopan.com/

TOP

叙利亚、埃及

http://shaoniu.gbaopan.com/

TOP

TOP

梅厄夫人自传

http://shaoniu.gbaopan.com

TOP

TOP

TOP

巴基斯坦

http://iask.sina.com.cn/h/user.php?uid=1306107190&fixed=ishare

又要换地方了,真是。。。以前的资料稍后转移吧。有什么好的网络空间吗

[ 本帖最后由 异教徒 于 2007-7-21 02:32 编辑 ]

TOP

TOP

TOP

告诉我不存在下载文件

TOP

刚上传的文件要等一段时间才显示出来。现在已经出来了。

TOP

古巴。最新上传的是战斗队员的黑体版

http://home.iask.com/user.php?uid=1306107190&fixed=ishare

TOP

发新话题