`
李俊良
  • 浏览: 141224 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

word存的html中的unicode中文转码为标准中文

 
阅读更多
 var fs = require("fs");
  
  
   fs.readFile("page.htm",function(err,data){
      var str = data.toString();
      var matchs = str.match(/&#[0-9]{5};/gm);
      for(var i = 0 ; i < matchs.length ; i++){
          var ma = matchs[i];
          var a = ma.replace("&#","").replace(";","");
          a = parseInt(a).toString(16);
          console.log(unescape('%u'+a));
          str = str.replace(ma,unescape("%u"+a));
      }
      fs.writeFile("out.htm",str,function(){
          console.log("写入成功");
     })
     console.log(matchs.length,matchs[0]);
 })

 

分享到:
评论

相关推荐

    ConvertZ中文 Big5/GBK/Unicode/UTF8 内码转换器

    用途: 中文 Big5/GBK/Unicode/UTF8 内码转换器。  注意:档案转换只能将纯文字格式的文件(例如 txt, html 等)转码,  并不适用于如 MS Word, Excel 等 binary 档案。 系统要求: 视窗9x/ME/NT/2000/XP/2003

    中文 Big5/GBK/Unicode/UTF8 内码转换器

    档案转换只能将纯文字格式的文件(例如 txt, html 等)转码,并不适用于如 MS Word, Excel 等 binary 档案。

    ConvertZ_8.02

    ConvertZ 是一个中文内码转换器,用于中文 Big5/GBK/Unicode/UTF8 内码转换。能够让你随心所欲地将简体文件转换成繁体文件,转换速度相当快。 支持同时转换多个文件文件、提供文件及剪贴簿内码转换,且无文件大小...

    convertz802_bkill

    用途: 中文 Big5/GBK/Unicode/UTF8 内码转换器。 注意:档案转换只能将纯文字格式的文件(例如 txt, html 等)转码, 并不适用于如 MS Word, Excel 等 binary 档案。 系统要求: 视窗9x/ME/NT/2000/XP/2003 安装: 将...

    convertz802

    为节省程式的开发时间,ConvertZ 用Windows 内建的 API 进行 unicode 内码的转换,故此视窗必须已经同时已安装繁体 (codepage 950) 及简体 (codepage 936) 的中文支援。 ConvertZ 于启动时会侦查系统,若发现缺少...

    convertz 编码转换

    中文 Big5/GBK/Unicode/UTF8 内码转换器。  注意:档案转换只能将纯文字格式的文件(例如 txt, html 等)转码,  并不适用于如 MS Word, Excel 等 binary 档案

    ConvertZ_8.02.7.rar

    用途: 中文 Big5/GBK/Unicode/UTF8 内码转换器。  注意:档案转换只能将纯文字格式的文件(例如 txt, html 等)转码,  并不适用于如 MS Word, Excel 等 binary 档案。

    Java开发实战1200例(第1卷).(清华出版.李钟尉.陈丹丹).part3

    本书是第II卷,以开发人员在项目开发中经常遇到的问题和必须掌握的技术为中心,介绍了应用Java进行桌面程序开发各个方面的知识和技巧,主要包括Java语法与面向对象技术、Java高级应用、窗体与控件应用、文件操作...

Global site tag (gtag.js) - Google Analytics