形近专题

英语复习之英语形近词总结(二)

接着总结形近词 单词释义例句 impress 英 /ɪmˈpres/ 美 /ɪmˈpres/   vt.盖印;强征;传送;给予某人深刻印象 vi.给人印象。印象,印记;特征,痕迹 1.It didn't impress me as a good place to live. 那地方没有给我留下适合居住的印象。 2.That idea seemed to impress Coli

英语形近义近单词

blind, bland, blondintimidate, intimate, imitate, timidlie-lied-lied to him 说谎lay-laid-laid some eggs 产卵,放置lie-lay-lain in the ground 躺,位于oil, boil, soil, spoilspot, dirt, dust, mud, smearrib, rid, ri

NLP(四十八)文本纠错之获取形近字

简介   笔者最近在从事文本纠错的相关工作,颇有收获,因此记录于此。   文本纠错很大一部分工作在于纠正同音字、形近字,所谓形近字,是指字形相近的汉字。本文将介绍如何获取形近字。   获取形近字的算法如下: 获取汉字库,将所有汉字转化为黑白图片;获取每个汉字的向量表示(即将图片转化为向量);计算两个汉字的向量的余弦相似度,得到它们的字形相似度。   下面将详细演示如何获取形近字。 获取形近

NLP 开源形近字算法补完计划(完结篇)

前言 所有的故事都有开始,也终将结束。 本文将作为 NLP 汉字相似度的完结篇,为该系列画上一个句号。 起-NLP 中文形近字相似度计算思路 承-中文形近字相似度算法实现,为汉字 NLP 尽一点绵薄之力 转-当代中国最贵的汉字是什么? 不足之处 之所以有本篇,是因为上一次的算法实现存在一些不足。 巴别塔 《圣经》中有关于巴别塔建造,最终人们因为语言问题而停工的故事​。 创1

NLP 开源形近字算法补完计划(完结篇)

前言 所有的故事都有开始,也终将结束。 本文将作为 NLP 汉字相似度的完结篇,为该系列画上一个句号。 起-NLP 中文形近字相似度计算思路 承-中文形近字相似度算法实现,为汉字 NLP 尽一点绵薄之力 转-当代中国最贵的汉字是什么? 不足之处 之所以有本篇,是因为上一次的算法实现存在一些不足。 巴别塔 《圣经》中有关于巴别塔建造,最终人们因为语言问题而停工的故事​。 创1

NLP 中文形近字相似度算法开源实现

项目简介 nlp-hanzi-similar 为汉字提供相似性的计算。 创作目的 有一个小伙伴说自己在做语言认知科学方向的课题研究,看了我以前写的 NLP 中文形近字相似度计算思路 就想问下有没有源码或者相关资料。 国内对于文本的相似度计算,开源的工具是比较丰富的。 但是对于两个汉字之间的相似度计算,国内基本一片空白。国内的参考的资料少的可怜,国外相关文档也是如此。 于是将以前写