导航菜单
首 页
模板
查询
套餐
代理
资讯
案例
关于
入口
您的位置:
首 页
>
新闻中心
>
企业网站设计
> 企业网站设计基于机器学习的通用识别方式
官网公告
服务领域
企业网站建设
公司网站制作
企业网站设计
企业建网站
企业做网站
手机网站建设
网站SEO优化
动态观点
资讯动态
行业动态
企业网站建设
公司网站制作
企业网站设计
企业建网站
企业做网站
手机网站建设
网站SEO优化
企业网站设计
企业网站设计基于机器学习的通用识别方式
发布:2020-12-22 13:04:57 浏览:1729
基于机器学习的通用识别方式
。近年来随着机器学习算法的兴起,很多文献提出将相关算法用到垃圾页面识别并已经取得了很好的效果。
由于从本质上来说垃圾页面识别是一个二值分类问题,而机器学习中有很多相应的算法可以被利用。这些算法的共同点通常都是先将网页数据集分为训练集和测试集,然后对网页数据进行预处理,去除数据中的无用信息包括HTML标签、Java Script脚本代码、大量存在的图片等等,然后对网页内容特征(网页字数、标题字数、热门关键词、网页压缩率等)和链接结构特征(入链数、出链数、入链出链比例、Page Rank值等)进行提取作为训练集的输入得出输入输出的映射关系,最后将这种映射关系用测试集进行验证。
>>> 查看
《企业网站设计基于机器学习的通用识别方式》
更多相关资讯 <<<
本文地址:http://www.phpweb.com.cn/news/html/22560.html
上一个:
企业网站设计设计和测试
下一个:
企业网站设计利用色相差而形成的配色方法(下)
首页
手机
分类
顶部
友情链接
谷歌地图
百度地图
HTML地图
TXT地图
华友机械
恒悦房地产
网站设计
广志建设工程
PHP开发
建站代理
赶快点击我,让我来帮您!