类库
› goose
GravityLabs/goose
ArchivedGoose是一个用Scala编写的HTML内容和文章提取器,旨在从新闻文章或网页中提取主文本、图像及元数据,适用于需要展示网页摘要的应用。
技术栈
根目录 java
查看全部依赖 (9)
依赖
commons-io:commons-io
commons-lang:commons-lang
junit:junit
org.apache.httpcomponents:httpclient
org.jsoup:jsoup
org.scala-lang:scala-compiler
org.scala-lang:scala-library
org.slf4j:slf4j-api
org.slf4j:slf4j-log4j12