小李飞刀资源网 Design By www.iooab.com
一般情况下先用PHP的 strip_tags 函数去掉所有html标签,再去掉空格等,然后再用substr或者自己实现的cn_substr函数来实现截取。因为如果不先去掉html标签,直接截取出来的字符串就会有没有闭合的标签出现,有时甚至会截取在标签上面比如
复制代码 代码如下: </di ...
今天遇到一个内容翻页截取问题: 正文是用富文本编辑器写入的,编辑器上有个分页按钮,点击之后就往当前光标位置插入一个蓝色的
复制代码 代码如下: <hr />
横线。然后php直接存入数据库。显示的时候,用 explode 函数根据这个
复制代码 代码如下: <hr />
标记来分成一个数组,然后根据当前页码来显示某个片段。 但是有个严重的问题,比如富文本编辑器写入:
复制代码 代码如下:
<div style="text-align:center">
content of page 1
<hr />
page 2 content
</div>
如果用explode函数分开后,
第一页的内容是
复制代码 代码如下:
<div style="text-align:center">
content of page 1
第二页的内容是:
复制代码 代码如下:
page 2 content
</div>
这样就产生了没有闭合的标签,直接显示到页面上面就会破坏页面布局。。。
想了很久,也找了网上很多 closetag函数。但是发现都针对第一页那种没有闭合的标签的闭合。对于第二种没有开头的标签就没办法了。
针对第一页那种没有闭合的标签的闭合的closetags方法是:
复制代码 代码如下:
function closetags($html) {
// 不需要补全的标签
$arr_single_tags = array('meta', 'img', 'br', 'link', 'area');
// 匹配开始标签
preg_match_all('#<([a-z]+)(?: .*)?(?<![/|/ ])>#iU', $html, $result);
$openedtags = $result[1];
// 匹配关闭标签
preg_match_all('#</([a-z]+)>#iU', $html, $result);
$closedtags = $result[1];
// 计算关闭开启标签数量,如果相同就返回html数据
$len_opened = count($openedtags);
if (count($closedtags) == $len_opened) {
return $html;
}
// 把排序数组,将最后一个开启的标签放在最前面
$openedtags = array_reverse($openedtags);
// 遍历开启标签数组
for ($i = 0; $i < $len_opened; $i++) {
// 如果需要补全的标签
if (!in_array($openedtags[$i], $arr_single_tags)) {
// 如果这个标签不在关闭的标签中
if (!in_array($openedtags[$i], $closedtags)) {
// 直接补全闭合标签
$html .= '</' . $openedtags[$i] . '>';
} else {
unset($closedtags[array_search($openedtags[$i], $closedtags)]);
}
}
}
return $html;
}
后来想了一个办法,利用浏览器自己的html解释引擎来帮助补全有问题的html片段。具体做法如下:
复制代码 代码如下:
<script>
var div = document.createElement('div');
div.innerHTML ='<?php echo ("<div>这里是被截取的html片段");?>';
document.write(div.innerHTML);
</script>
原理就是先把html片段写入到一个空的div里面,然后再从这个div里面读取出来。别看写入和读取的属性都是innerHTML,写入的内容和得到的内容是不一样的噢。如果写入不完整的html片段,浏览器会自动补全修正。读取出来的时候就已经是完整的html dom 片段了。
可是这样有个弊端,由于是Js加载内容信息的,会对搜索引擎优化不好。
复制代码 代码如下: </di ...
今天遇到一个内容翻页截取问题: 正文是用富文本编辑器写入的,编辑器上有个分页按钮,点击之后就往当前光标位置插入一个蓝色的
复制代码 代码如下: <hr />
横线。然后php直接存入数据库。显示的时候,用 explode 函数根据这个
复制代码 代码如下: <hr />
标记来分成一个数组,然后根据当前页码来显示某个片段。 但是有个严重的问题,比如富文本编辑器写入:
复制代码 代码如下:
<div style="text-align:center">
content of page 1
<hr />
page 2 content
</div>
如果用explode函数分开后,
第一页的内容是
复制代码 代码如下:
<div style="text-align:center">
content of page 1
第二页的内容是:
复制代码 代码如下:
page 2 content
</div>
这样就产生了没有闭合的标签,直接显示到页面上面就会破坏页面布局。。。
想了很久,也找了网上很多 closetag函数。但是发现都针对第一页那种没有闭合的标签的闭合。对于第二种没有开头的标签就没办法了。
针对第一页那种没有闭合的标签的闭合的closetags方法是:
复制代码 代码如下:
function closetags($html) {
// 不需要补全的标签
$arr_single_tags = array('meta', 'img', 'br', 'link', 'area');
// 匹配开始标签
preg_match_all('#<([a-z]+)(?: .*)?(?<![/|/ ])>#iU', $html, $result);
$openedtags = $result[1];
// 匹配关闭标签
preg_match_all('#</([a-z]+)>#iU', $html, $result);
$closedtags = $result[1];
// 计算关闭开启标签数量,如果相同就返回html数据
$len_opened = count($openedtags);
if (count($closedtags) == $len_opened) {
return $html;
}
// 把排序数组,将最后一个开启的标签放在最前面
$openedtags = array_reverse($openedtags);
// 遍历开启标签数组
for ($i = 0; $i < $len_opened; $i++) {
// 如果需要补全的标签
if (!in_array($openedtags[$i], $arr_single_tags)) {
// 如果这个标签不在关闭的标签中
if (!in_array($openedtags[$i], $closedtags)) {
// 直接补全闭合标签
$html .= '</' . $openedtags[$i] . '>';
} else {
unset($closedtags[array_search($openedtags[$i], $closedtags)]);
}
}
}
return $html;
}
后来想了一个办法,利用浏览器自己的html解释引擎来帮助补全有问题的html片段。具体做法如下:
复制代码 代码如下:
<script>
var div = document.createElement('div');
div.innerHTML ='<?php echo ("<div>这里是被截取的html片段");?>';
document.write(div.innerHTML);
</script>
原理就是先把html片段写入到一个空的div里面,然后再从这个div里面读取出来。别看写入和读取的属性都是innerHTML,写入的内容和得到的内容是不一样的噢。如果写入不完整的html片段,浏览器会自动补全修正。读取出来的时候就已经是完整的html dom 片段了。
可是这样有个弊端,由于是Js加载内容信息的,会对搜索引擎优化不好。
标签:
自动补全
小李飞刀资源网 Design By www.iooab.com
广告合作:本站广告合作请联系QQ:858582 申请时备注:广告合作(否则不回)
免责声明:本站文章均来自网站采集或用户投稿,网站不提供任何软件下载或自行开发的软件! 如有用户或公司发现本站内容信息存在侵权行为,请邮件告知! 858582#qq.com
免责声明:本站文章均来自网站采集或用户投稿,网站不提供任何软件下载或自行开发的软件! 如有用户或公司发现本站内容信息存在侵权行为,请邮件告知! 858582#qq.com
小李飞刀资源网 Design By www.iooab.com
暂无评论...
稳了!魔兽国服回归的3条重磅消息!官宣时间再确认!
昨天有一位朋友在大神群里分享,自己亚服账号被封号之后居然弹出了国服的封号信息对话框。
这里面让他访问的是一个国服的战网网址,com.cn和后面的zh都非常明白地表明这就是国服战网。
而他在复制这个网址并且进行登录之后,确实是网易的网址,也就是我们熟悉的停服之后国服发布的暴雪游戏产品运营到期开放退款的说明。这是一件比较奇怪的事情,因为以前都没有出现这样的情况,现在突然提示跳转到国服战网的网址,是不是说明了简体中文客户端已经开始进行更新了呢?
更新日志
2024年10月22日
2024年10月22日
- 群星2013-青春缤纷辑压箱宝大公开3CD2[新加坡限量版][WAV整轨]
- 林育群.2013-BalladShow(日本版)【环球】【WAV+CUE】
- 陈加洛.1992-痛到感觉不到【宝丽金】【WAV+CUE】
- 群星.2023-宿命之敌电视剧原声带【韶愔音乐】【FLAC分轨】
- 東京事変-大発見[FLAC+CUE]
- 椎名林檎-三文ゴシップ[FLAC+CUE]
- 2024年08月04日
- 裘德《裘德「最后的水族馆」演唱会LIVE》[320K/MP3][228.89MB]
- 裘德《裘德「最后的水族馆」演唱会LIVE》[24bit 48kHz][FLAC/分轨][2.08G]
- 基因三重奏《如果你什么都不说 音乐会现场录音》[320K/MP3][145.37MB]
- 孟庭苇.1996-月亮说话(2020环球24KGOLD限量版)【上华】【WAV+CUE】
- 群星.1997-新艺宝优质音响系列·国语精选监听版【新艺宝】【WAV+CUE】
- 阿桑.2005-寂寞在唱歌(星外星引进版)【华研国际】【WAV+CUE】
- 基因三重奏《如果你什么都不说 音乐会现场录音》[FLAC/分轨][287.43MB]
- 蔡题谦《我爱你,却依然要看你走》[320K/MP3][88.65MB]