刮削

什么是刮削

刮削就是根据文件名和番号去相关网站下载其基本信息例如导演、演员、简介、封面等。

对于不同的文件类别理论上有不同的刮削方案，目前PLM只支持电影和日本AV视频的刮削，一定程度上支持图书、音乐的刮削(使用Douban)。

刮削的原理是使用文件的标题或番号访问指定的网站进行搜索，并攫取和解释其结果页面信息保存在文件记录里面。也是由于此原因，许多网站例如JavDB会对频繁查询的IP进行限制访问以达到反爬目的，虽然PLM并非以爬虫目的访问这些网站，但其行为的确有相似之处，所以如果使用者使用PLM短期内大量访问这些有反爬机制的网站，很可能会遭遇网站有限时间内的限制访问甚至拉黑，强烈建议使用者每次/天批量刮削不要太多记录，也可以使用VPN来辅助：每批刮削完毕后使用VPN连接到不同的服务器得到不同的IP后才进行下一批刮削。

部分网站(例如JavLibrary和JavBus)，会要求使用者首次甚至每批(例如JavLibrary)刮削时需要人工进行年龄或者同意验证，可在选择刮削器时点击"网站"按钮进行同意操作，PLM也会试图自动判断是否需要人工干预。

鉴于许多下载好的电影文件名包含各种标签，建议使用AI获取标题操作先将这些文件名进行清洗后获得合理的电影标题，PLM刮削时会优先使用标题字段内容，然后才是文件名。

刮削完成后，如果刮削器使用的不是合适的语言，建议编辑该文件内容并使用翻译按钮进行简介、演员、导演、标签等进行翻译。

在刮削时会先弹出刮削器清单供使用者勾选，可同时勾选多个(使用上移/下移按钮调整次序)，那么在第一个失败或找不到信息的情况下PLM会顺序使用其它被选中的刮削器; 如果存在方案配置，可在对话框右下角选取方案快速选择; 可点击"网站"按钮访问该网站或进行同意操作。

使用者可自行编写脚本进行刮削，具体可参考 $安装文件夹\scraper\javdb.pas、javhub.pas等内置样例。

支持哪些刮削器

当前PLM支持的刮削器：

IMDB: 知名电影信息网站，可对电影刮削，给出封面、导演、演员、简介、评分等信息，支持多种语言

Douban: 豆瓣为中国知名电影、书籍、音乐信息评价网站，可对电影、书籍、音乐进行刮削，给出封面、导演、演员、简介、评分等信息

TheMovieDB: 知名电影信息网站，可对电影刮削，给出封面、导演、演员、简介、评分等信息

JavDB: 大型日本AV影片信息网站，该网站的特点是影片信息比较多而全，缺点是有反爬机制和图片水印，语言也只支持繁体中文和英文两种

JavLibrary: 大型日本AV影片信息网站，该网站主要特点是支持语言比较多(例如日语)和提供跟帖让使用者可能下载到该AV影片，缺点是基本上每批刮削都需要手工同意动作

JavBus: 大型日本AV影片信息网站，该网站主要特点是旧影片信息比较多和访问速度比较快也支持日语/韩文，缺点是首次使用(或清空浏览器缓存后)需进行人工验证且该验证为随机驾驶中文考题，需要使用者自行google并全部回答正确

JavHub: 该网站主要特点是支持英语/日语

如何重新刮削

如果文件已经刮削过，除非在选择"刮削"操作时勾选了"强制重做"或者编辑文件时点击了"清除信息"按钮把相关数据清除掉，PLM不会再对其进行实际的刮削操作。