GeneralNewsExtractor新闻网页正文通用抽取器是一个基于《基于文本及符号密度的网页正文提取方法》论文用Python实现的正文抽取器,可以用来提取HTML中正文的内容、作者、标题。
版权声明:GeneralNewsExtractor(新闻网页正文通用抽取器)所展示的资源内容均来自于第三方用户上传分享,您所下载的资源内容仅供个人学习交流使用,严禁用于商业用途,软件的著作权归原作者所有,如果有侵犯您的权利,请来信告知,我们将及时撤销。
软件下载信息清单:
驱动文件名称 | 发布日期 | 文件大小 | 下载文件名 |
---|---|---|---|
GeneralNewsExtractor(新闻网页正文通用抽取器)安装包 | 2024年11月9日 | 15KB | gne-0.2.6.tar.gz |
软件评论