galgame的文本一般怎么提取?
galgame的cg可以提取
下载个crass软件,打开软件,指定源文件打上勾,点浏览找到.ypf有时格式也可能是..PAK、.ARC、.AR的文件。
.ypf有可能在pac文件夹里,有些游戏是Data文件夹里,有些直接在根目录里,点击执行即可提取crass软件可以自己下载也可以在追问中留邮。
基于TextRank的游戏文本提取
TextRank算法的思想直接借鉴了PageRank网页排序算法,使用在K长度窗口中词的相邻关系来代表PR算法中的链接指向关系,与PageRank的迭代公式完全相同,基于TextRank的方法简单有效,速度也在可接受的范围内。但这一方法存在两个较为明显的不足:
1、关键词的来源有限,仅为本篇文档所有词汇的集合,难以学习到更多的关键词表示,也无法以“生成”的方式得到文章抽象的关键词表述。
2、虽然TextRank考虑了关键词在给定距离窗口的***现等信息,但实际上仍然偏向于给高频词以更高的权重,所以在实际使用中与TF-IDF这类方法相比没有太大的优势。