自动爬取信息源 标扬“通集令”核心技术包含智能的“网络爬虫”技术,可根据用户指定的信息源设置,取回相关的网页。该技术可分析出信息源网站的的信息和网页查询方式,生成http指令,向该信息源发送,从而将该信息源上所有的有用网页爬取下来,作进一步处理。
自动抽取信息 标扬“通集令”核心技术可根据用户设定的信息模板,把资料网页中的信息抽取出来,并自动保存到指定的数据库中。就如同一个熟练的信息收集员一样,将网页中有用的文字,快速准确地保存到数据库中。
自动追踪更新信息 标扬“通集令”核心技术包含智能的信息来源识别机制,能自动判断已经下载的信息是否在网上有了新的变化,并能根据用户指定的时间和间隔,自动到信息源上查看是否有未收集的新信息内容出现。 这种自动追踪和更新信息的功能,可确保用户能及时全面地收集到最新的信息。
“通集令”研发背景
“通集令”成功案例