刮削就是根据文件名和番号去相关网站下载其基本信息例如导演、演员、简介、封面等。
对于不同的文件类别理论上有不同的刮削方案,目前PLM只支持电影和日本AV视频的刮削,一定程度上支持图书、音乐的刮削(使用Douban)。
刮削的原理是使用文件的标题或番号访问指定的网站进行搜索,并攫取和解释其结果页面信息保存在文件记录里面。也是由于此原因,许多网站例如JavDB会对频繁查询的IP进行限制访问以达到反爬目的,虽然PLM并非以爬虫目的访问这些网站,但其行为的确有相似之处,所以如果使用者使用PLM短期内大量访问这些有反爬机制的网站,很可能会遭遇网站有限时间内的限制访问甚至拉黑,强烈建议使用者每次/天批量刮削不要太多记录,也可以使用VPN来辅助:每批刮削完毕后使用VPN连接到不同的服务器得到不同的IP后才进行下一批刮削。
部分网站(例如JavLibrary和JavBus),会要求使用者首次甚至每批(例如JavLibrary)刮削时需要人工进行年龄或者同意验证,可在选择刮削器时点击"网站"按钮进行同意操作,PLM也会试图自动判断是否需要人工干预。
鉴于许多下载好的电影文件名包含各种标签,建议使用AI获取标题操作先将这些文件名进行清洗后获得合理的电影标题,PLM刮削时会优先使用标题字段内容,然后才是文件名。
刮削完成后,如果刮削器使用的不是合适的语言,建议编辑该文件内容并使用翻译按钮进行简介、演员、导演、标签等进行翻译。
在刮削时会先弹出刮削器清单供使用者勾选,可同时勾选多个(使用上移/下移按钮调整次序),那么在第一个失败或找不到信息的情况下PLM会顺序使用其它被选中的刮削器; 如果存在方案配置,可在对话框右下角选取方案快速选择; 可点击"网站"按钮访问该网站或进行同意操作。
使用者可自行编写脚本进行刮削,具体可参考 $安装文件夹\scraper\javdb.pas、javhub.pas等内置样例。
当前PLM支持的刮削器:
如果文件已经刮削过,除非在选择"刮削"操作时勾选了"强制重做"或者编辑文件时点击了"清除信息"按钮把相关数据清除掉,PLM不会再对其进行实际的刮削操作。