求知

探索知识边界,点亮智慧之光

如何挖掘收录口子之搜狗强制收录法-搜狗网页翻译(17年流行)

搜索杂谈

如何挖掘收录口子之搜狗强制收录法-谷歌/百度收录+搜狗浏览器(18年流行)

搜索杂谈

如何挖掘收录口子之搜狗强制收录法-模拟用户行为,“您可以直接访问 XXX”

搜索杂谈

基于百度开源项目LAC实现批量文本分词

常用工具

简单词根包含脚本,python

经常会用到,比如过滤已生成过的关键词(包含关系),相等关系直接用编辑器去重就好,推荐编辑器notepad++、sublime;提取包含词根的关键词等等,不区分大小写ok.txt,存放包含关键词的词根key.txt,词根keyword.txt,关键词ok = open('ok.txt','w',encoding='utf8') with open('keyword.txt',encoding="utf8") as wordlist: for keyword in wordlist: keyword = keyword.strip('\n') # kw,kurl = keyword.split('\t') with open('key.txt',encoding="utf8") as keylist: for k in keylist: k = k.strip('\n') if k.upper() in keyword.upper(): ok.write(k+'\n') break
加载更多