当前位置:首页 »“秋了秋”个人博客 » 前端编程 » 获取html字符串中纯文本字数

获取html字符串中纯文本字数

作者:秋了秋 发表时间:2022年02月08日

实质就是去除html中的标签,应用场景是非浏览器环境,比如后端环境中需要输出文章摘要或者统计文章字数。

复制代码
  1. /* 获取字符串中纯文本字数
  2.  * {html} 字符串
  3.  * {tags} 需要计数的标签名,如['img', 'hr'],如果有这些标签,计数加1
  4.  * {return} number 文本个数,多个换行符、制表符、空格算占位一个
  5.  */
  6. function getHtmlTextLength(html, tags) {
  7. var count = html.replace(/<[^<]+>/g, '').replace(/[\n\t\s]+/g, ' ').length;
  8. if(tags) {
  9. var reg = '<('+tags.join('|')+')[^<]+>';
  10. var matchs = html.match(new RegExp(reg, 'g'));
  11. if(matchs && matchs.length) {
  12. count += matchs.length;
  13. }
  14. }
  15. return count;
  16. }
复制代码

如果是浏览器环境,可直接使用浏览器api实现:

复制代码
  1. function getHtmlTextLength(html) {
  2. var span = document.createElement('span');
  3. span.innerHTML = html;
  4. return span.innerText.length;
  5. }
复制代码

使用示例:

复制代码
  1. getHtmlTextLength(`<h1 class="title-article" id="articleContentId">提取html字符串特定的文字内容</h1>`); //16
复制代码


8
文章作者: “秋了秋”个人博客,本站鼓励原创。
转载请注明本文地址:http://netblog.cn/blog/119.html
目录: 前端编程标签: 字符串文本统计 2989次阅读

检测到你在使用低版本浏览器不支持自动播放,请手动点击播放,将为你使用特制播放源播放。

请求播放音乐,请点击播放

登 录
点击获取验证码
还没账号?点击这里