类库 › goose
GravityLabs

GravityLabs/goose

Archived

Goose是一个用Scala编写的HTML内容和文章提取器,旨在从新闻文章或网页中提取主文本、图像及元数据,适用于需要展示网页摘要的应用。

1,531 318 1,531 63
在 GitHub 上查看

技术栈

根目录 java

查看全部依赖 (9)

依赖

commons-io:commons-io commons-lang:commons-lang junit:junit org.apache.httpcomponents:httpclient org.jsoup:jsoup org.scala-lang:scala-compiler org.scala-lang:scala-library org.slf4j:slf4j-api org.slf4j:slf4j-log4j12

评论

Accueil - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.2. UTC+08:00, 2026-07-06 00:55
浙ICP备14020137号-1 $Carte des visiteurs$