什么是刮削

刮削就是根据文件名和番号去相关网站下载其基本信息例如导演、演员、简介、封面等。

对于不同的文件类别理论上有不同的刮削方案,目前PLM只支持电影和日本AV视频的刮削,一定程度上支持图书、音乐的刮削(使用Douban)。

刮削的原理是使用文件的标题或番号访问指定的网站进行搜索,并攫取和解释其结果页面信息保存在文件记录里面。也是由于此原因,许多网站例如JavDB会对频繁查询的IP进行限制访问以达到反爬目的,虽然PLM并非以爬虫目的访问这些网站,但其行为的确有相似之处,所以如果使用者使用PLM短期内大量访问这些有反爬机制的网站,很可能会遭遇网站有限时间内的限制访问甚至拉黑,强烈建议使用者每次/天批量刮削不要太多记录,也可以使用VPN来辅助:每批刮削完毕后使用VPN连接到不同的服务器得到不同的IP后才进行下一批刮削。

部分网站(例如JavLibraryJavBus),会要求使用者首次甚至每批(例如JavLibrary)刮削时需要人工进行年龄或者同意验证,可在选择刮削器时点击"网站"按钮进行同意操作,PLM也会试图自动判断是否需要人工干预。

鉴于许多下载好的电影文件名包含各种标签,建议使用AI获取标题操作先将这些文件名进行清洗后获得合理的电影标题,PLM刮削时会优先使用标题字段内容,然后才是文件名。

刮削完成后,如果刮削器使用的不是合适的语言,建议编辑该文件内容并使用翻译按钮进行简介、演员、导演、标签等进行翻译。

在刮削时会先弹出刮削器清单供使用者勾选,可同时勾选多个(使用上移/下移按钮调整次序),那么在第一个失败或找不到信息的情况下PLM会顺序使用其它被选中的刮削器; 如果存在方案配置,可在对话框右下角选取方案快速选择; 可点击"网站"按钮访问该网站或进行同意操作。

使用者可自行编写脚本进行刮削,具体可参考 $安装文件夹\scraper\javdb.pas、javhub.pas等内置样例。

支持哪些刮削器

当前PLM支持的刮削器:

  • IMDB: 知名电影信息网站,可对电影刮削,给出封面、导演、演员、简介、评分等信息,支持多种语言
  • Douban: 豆瓣为中国知名电影、书籍、音乐信息评价网站,可对电影、书籍、音乐进行刮削,给出封面、导演、演员、简介、评分等信息
  • TheMovieDB: 知名电影信息网站,可对电影刮削,给出封面、导演、演员、简介、评分等信息
  • JavDB: 大型日本AV影片信息网站,该网站的特点是影片信息比较多而全,缺点是有反爬机制和图片水印,语言也只支持繁体中文和英文两种
  • JavLibrary: 大型日本AV影片信息网站,该网站主要特点是支持语言比较多(例如日语)和提供跟帖让使用者可能下载到该AV影片,缺点是基本上每批刮削都需要手工同意动作
  • JavBus: 大型日本AV影片信息网站,该网站主要特点是旧影片信息比较多和访问速度比较快也支持日语/韩文,缺点是首次使用(或清空浏览器缓存后)需进行人工验证且该验证为随机驾驶中文考题,需要使用者自行google并全部回答正确
  • JavHub: 该网站主要特点是支持英语/日语
  • 如何重新刮削

    如果文件已经刮削过,除非在选择"刮削"操作时勾选了"强制重做"或者编辑文件时点击了"清除信息"按钮把相关数据清除掉,PLM不会再对其进行实际的刮削操作。