rime中州韵小狼毫 联想词组 滤镜

2024-01-15 22:20

本文主要是介绍rime中州韵小狼毫 联想词组 滤镜,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

教程目录:rime中州韵小狼毫须鼠管安装配置教程 保姆级教程 100+增强功能配置教程

在 rime中州韵小狼毫 自定义词典 一文中,我们分享了如何在rime中州韵小狼毫须鼠管输入法中定义用户自定义词典;通过自定义词典,我们可以很方便的在输入法中加入个性化的词组。

根据 rime中州韵小狼毫 滤镜与字典的区别 一文所分析,通过自定义词典所定义和管理的个性化词组,会受到输入方案的耦合影响,这导致我们无法方便的直接的分享我们的自定义词典配置;并且对于一些动态词组(例如实时时间,实时日期,电脑信息等),也无法通过配置自定义词典来实现。

本文分享rime中州韵小狼毫须鼠管输入法的一个联想词组滤镜配置。该滤镜可以在候选列表中出现关键词组时,抛出附加的新的词组,例如下图👇中带有💡标记的词组,即为联想词组:
20240111152332

联想词组字典

联想词组字典的目的是提供有联想关系的词组,例如由词组“夫妻”,联想到词组“伉俪”,再如由词组“进步”,联想到词组“进步开始于起步”。

联想词组字典txt的文档,lua滤镜脚本支持多个txt文档分类管理不同的联想词组,且滤镜脚本会自动进行去重处理。

联想词组字典文档内支持以符号#开头的行作为注释行,以提升词组管理的便捷性。

联想词组文档内的文本分为2列,以tab制表符分隔。第1列为关键词组,关键词组可以有多个,以空格分隔。第2列为联想词组,联想词组可以有多个,以空格分隔。联想词组的联想是意向的,即只能由第1更的关键词组联想到第2列的联想词组,但是可以通过使第1列与第2列相等来实现相互联想,例如 “夫妻 伉俪 →夫妻 伉俪”,这样可以使“夫妻”和“伉俪”相互联想。

phraseExt commonPhrase.txt

phraseExt commonPhrase.txt文档用于管理一般性的公共性的联想词组,phraseExt commonPhrase.txt词组定义截取如下👇:

# 支持使用 &nbsp 来定义空格,而正常的空格被用于分词
# 常用链接
知乎	https://www.zhihu.com
百度 度娘	www.baidu.com
淘宝	www.taobao.com
谷歌 谷哥 谷姐	www.google.com
画图 几何 画板	https://webgeo-8gn07v0t78c4ca57-1308819187.tcloudbaseapp.com
# 常用称呼
运气 华盖	运气 华盖
南冠 囚犯	南冠 囚犯
伉俪 夫妻	伉俪 夫妻
丝竹 音乐	丝竹 音乐
烽烟 战争 狼烟	战争 烽烟 狼烟

phraseExt esAppEmoji.txt

phraseExt esAppEmoji.txt文档用于管理一些应用专属的emoji表情,例如我们可以在微信聊天中输入 [微笑],则微信会将其自动转换成 emoji 表情符号 🙂。我们在phraseExt esAppEmoji.txt文档中定义了一系列的此类emoji表情词组。phraseExt esAppEmoji.txt词组定义截取如下👇:

done 完成 搞定	esFs[完成] esDt[Done]
get 了解 知道	esFs[了解] esDt[Get]
no 不行	esFs[No] esFs[叉号] esDt[打叉]
错 错误	esFs[叉号] esDt[打叉]
ok 行 好的 好吧 可以	esFsWxDt[OK]
好 好的	esFs[Yes] esWx[好的]
行	esFs[我看行] esFs[好的]
okr 绩效	esFsDt[OKR]

👆如上,phraseExt esAppEmoji.txt 文档中的联想词组,以AppName作为前缀,不同的App应用,前缀符号映射👇如下:

应用前缀
微信Wx
飞书Fs
钉钉Dt
QQQq

💣注意:
特别的,AppEmoji的联想,需要配置应用开关才可以使用,关于应用开关的配置,请参考 rime中州韵小狼毫 weasel.custom.yaml 配置 之 输入环境识别 一文。

phraseExt esUnicode.txt

Unicode字符集中,存在着丰富的 emoji符号,如果不善于利用,则实在可惜。phraseExt esUnicode.txt文档专门用来管理与 Unicode 表情符号有关的联想词组,phraseExt esUnicode.txt联想词组定义截取如下👇:

垃圾 垃圾桶	🚮
开水	🚰
轮椅 残疾 无障碍	♿
厕所	🚻 🚾
厕所 男人 男厕	🚹
厕所 女人 女厕	🚺

善于使用 Unicode 表情符号,会使你成为一个高情商的人。

phraseExt personal.txt

顾名思义,phraseExt personal.txt文档是用来管理一些个人和,私有的联想词组的,例如你的电话号码,例如你的邮寄地址,再如你的爱情口头禅。phraseExt personal.txt联想词组定义示例如下👇:

# 支持使用 &nbsp 来定义空格,而正常的空间被用于分词
# 这个字典用于管理 个人/私人 信息,以便在共享/分享rime配置时,可以方便的将个人信息进行隔离
# 常用联系方式
电话 手机	123456789AB 123456789AC
快递 地址	湖南省长春市快乐区开心社区2栋305室
# 常用办公信息
工号	000000
邮箱	san.zhang@aibaba.com
快递 地址	浙江省杭州市阿里马马集团2号快递收发室
# 其它常用信息
博客	https://www.myblogs.com

如果你与它人分享你的rime输入法的配置方案,phraseExt personal.txt 的存在将使得你可以快速的将个人/私人信息与配置方案进行隔离。

phraseExt_Module.lua

phraseExt_Module.lua 是一个lua脚本文档,phraseExt_Module.lua脚本文档的使用是将以上👆所管理的联想词组加载到lua程序中,并提供合适的检索方法接口,以便rime引擎可以使用联想词功能。phraseExt_Module.lua脚本内容如下👇:

-- myPhrase.lua
-- Copyright (C) 2023 yaoyuan.dou <douyaoyuan@126.com>
local M={}
local dict={}
local dictPhraseList={}
local dbgFlg = false--引入系统变更处理模块
local ok, sysInfoRes = pcall(require, 'sysInfo')
local currentDir = sysInfoRes.currentDir--设置 dbg 开关
local function setDbg(flg)dbgFlg = flgsysInfoRes.setDbg(flg)print('myPhrase dbgFlg is '..tostring(dbgFlg))
end--将这附串拆散成 table
local function stringSplit(str,sp,sp1)sp=(type(sp)=="string") and sp or " "if 0==#sp thensp="([%z\1-\127\194-\244][\128-\191]*)"elseif 1==#sp thensp="[^"..(sp=="%" and "%%" or sp).."]*"elsesp1=sp1 or "^"str=str:gsub(sp,sp1)sp="[^"..sp1.."]*"endlocal tab={}for v in str:gmatch(sp) doif ''~=v thentable.insert(tab,v)endendreturn tab
end--将文档处理成行数组
local function files_to_lines(...)if dbgFlg thenprint("--->files_to_lines called here")endlocal tab=setmetatable({},{__index=table})local index=1for i,filename in next,{...} dolocal fn = io.open(filename)if fn thenfor line in fn:lines() doif not line or #line > 0 thentab:insert(line)endendfn:close()endendif dbgFlg thenprint("--->files_to_lines completed here")endreturn tab
endlocal function dictload(...) -- filename)if dbgFlg thenprint("-->dictload called here")endlocal lines=files_to_lines(...)local thisDict={}for i,line in next ,lines doif not line:match("^%s*#") then  -- 第一字 # 为注释行local keys,val = string.match(line,"(.+)\t(%C+)")if nil ~= keys then--尝试对关键字进行空格分割local keyList = stringSplit(keys,' ')local key=''for idx=1,#keyList dokey = keyList[idx]if nil ~= thisDict[key] then--如果该key已经存在,追加在后面,注意加一个空格thisDict[key] = thisDict[key]..' '..valelsethisDict[key] = valendendendendendif dbgFlg thenprint("-->dictload completed here")endreturn thisDict
end--===========================test========================
local function test(printPrefix)if nil == printPrefix thenprintPrefix = ' 'endif dbgFlg thenprint('myPhrase test starting...')endsysInfoRes.test(printPrefix..' ')for k,v in pairs(dict) doif dbgFlg thenprint(printPrefix..k..'\t'..v)endend
end--获取字典中的phraseList
local function getPhraseList(k)if nil == k thenreturn {}elseif '' == k thenreturn {}end--尝试获取 dictPhraseList 中 k 的列表local phraseList = dictPhraseList[k]if nil == phraseList then--phraseList 获取失败,尝试获取 dict 中 k 的字符串local thisPhrase = dict[k]if nil == thisPhrase then--这个 k 在dict中不存在phraseList={}elseif thisPhrase == '' then--这个 k 在dict中是空的phraseList={}else--将获取的 thisPhrase 序列化到 dictPhraseList 中dictPhraseList[k]=stringSplit(thisPhrase,' ')--再次从 dictPhraseList 中获取 k 的序列phraseList = dictPhraseList[k]endendreturn phraseList
endfunction M.init(...)local files={...}--文件名不支持中文,其中 # 开始的行为注释行table.insert(files,"phraseExt commonPhrase.txt")table.insert(files,"phraseExt esAppEmoji.txt")table.insert(files,"phraseExt esUnicode.txt")table.insert(files,"phraseExt personal.txt")for i,v in next, files dofiles[i] = currentDir().."/".. venddict= dictload(table.unpack(files))--抛出功能函数M.getPhraseList = getPhraseListM.setDbg = setDbgM.test = test
endM.init()return M

👆以上脚本中,我们在M.init() 方法中看到了联想词组字典的加载方法:table.insert(files,"phraseExt personal.txt"),你如果有其它的联想词组字典,你也可以很方便的加载它们。

phraseExt_Module.lua 脚本提供了一个名为getPhraseList方法,该方法可以根据指定的关键词组,从联想词组字典对象dict中检索并返回对应的联想词组。

phraseExt_Filter.lua

phraseExt_Filter.lua脚本实现了匹配rime引擎的Filter滤镜,phraseExt_Filter.lua脚本定义并返回了phraseExt_Filter滤镜方法,phraseExt_Filter.lua脚本内容如下👇:

-- myPhrase_Filter.lua
-- Copyright (C) 2023 yaoyuan.dou <douyaoyuan@126.com>
local dbgFlg = falselocal ok, res = pcall(require, 'phraseExt_Module')
local getPhraseList = res.getPhraseList--最长的comment长度限制
local maxLenOfComment = 250--设置 dbg 开关
local function setDbg(dbgFlg)res.setDbg(dbgFlg)
end--过滤器
local function phraseExt_Filter(input, env)--获取选项增强开关状态local on = env.engine.context:get_option("phraseExt")--获取应用程序标记状态[由于飞书暂不支持文本转表情的输入,帮使用 and false 将其关闭]local feishuFlg = env.engine.context:get_option("feishuFlg") and falselocal wechatFlg = env.engine.context:get_option("wechatFlg")local qqFlg = env.engine.context:get_option("qqFlg")local dingdingFlg = env.engine.context:get_option("dingdingFlg")local minttyFlg = env.engine.context:get_option("minttyFlg")local cmdFlg = env.engine.context:get_option("cmdFlg")local pycharmFlg = env.engine.context:get_option("pycharmFlg")local vscodeFlg = env.engine.context:get_option("vscodeFlg")local matchedTxt = ''local esType = ''local esTxt = ''local cands={}local thisTxtfor cand in input:iter() do--提交默认选项if nil == cands[cand.text] thenyield(cand)cands[cand.text]=trueendif on thenlocal candTxt = cand.text:gsub("%s","") or ""if candTxt ~= "" then--获取增强选项local phraseList = getPhraseList(candTxt)if #phraseList > 0 thenlocal idxfor idx=1,#phraseList dothisTxt=phraseList[idx]if nil == cands[thisTxt] thencands[thisTxt]=trueesType,esTxt = string.match(thisTxt,"^es(.+)(%[.+%])$")if nil ~= esType thenesType = string.lower(esType)--这是一个表情选项if feishuFlg and nil ~= string.find(esType,'fs') then--这是一个 feishu 表情,且当前在 feishu 中输入if nil ~= esTxt thenyield(Candidate("word", cand.start, cand._end, esTxt, '😃'))endelseif wechatFlg and nil ~= string.find(esType,'wx') then--这是一个 wechat 表情,且当前在 wechat 中输入if nil ~= esTxt thenyield(Candidate("word", cand.start, cand._end, esTxt, '😃'))endelseif qqFlg and nil ~= string.find(esType,'qq') then--这是一个 QQ 表情,且当前在 QQ 中输入if nil ~= esTxt thenyield(Candidate("word", cand.start, cand._end, esTxt, '😃'))endelseif dingdingFlg and nil ~= string.find(esType,'dt') then--这是一个 dingtalk 表情,且当前在 钉钉 中输入if nil ~= esTxt thenyield(Candidate("word", cand.start, cand._end, esTxt, '😃'))endendelse--这不是一个表情选项if string.lower(string.sub(thisTxt, 1, 4)) == 'git-' then-- 这是一个以 git 开头的选项,这被认为是一个 git 命令if minttyFlg or cmdFlg then-- 修剪选项thisTxt = string.sub(thisTxt, 5)-- git 命令选项只在 cmd 窗口或者是 mitty 窗口才允许输出,以避免造成干扰yield(Candidate("word", cand.start, cand._end, thisTxt:gsub("&nbsp"," "), '💡'))endelseif string.lower(string.sub(thisTxt, 1, 3)) == 'py-' then-- 这是一个以 py- 开头的选项,这被认为是一个 python 关键字if pycharmFlg or vscodeFlg then-- 修剪选项thisTxt = string.sub(thisTxt, 4)-- python 关键字选项只在 pycharm 或者 vscode 中才允许输出, 以避免造成干扰yield(Candidate("word", cand.start, cand._end, thisTxt:gsub("&nbsp"," "), '💡'))endelseyield(Candidate("word", cand.start, cand._end, thisTxt:gsub("&nbsp"," "), '💡'))endendendendendendendend
endreturn phraseExt_Filter

👆以下脚本代码中,我们可以看到一组开关状态获取代码,如下👇:
20240111162804
这些开关变量,使得一些特定的词组(例如App表情)只会在对应的应用程序环境下才会出现。例如只有在微信中进行录入时,才会出现微信专有的emoji词组,而在txt环境下录入时,则不会出现微信专属的emoji词组,这大大提升了输入法的录入体验。

💣注意:
以上👆所述文档 phraseExt commonPhrase.txtphraseExt esAppEmoji.txtphraseExt esUnicode.txtphraseExt personal.txtphraseExt_Filter.luaphraseExt_Module.lua6个文档,应该位于 用户文件夹下的 lua 文件夹内,如下👇:
20240111163444

rime.lua

rime.lua脚本的内容如下👇:

help_translator = require("help")
inputShow_translator = require("inputShow")
inputShow_Filter = require("inputShow_Filter")
Upper_Filter = require("Upper_Filter")
dic_4w_Filter = require("dic_4w_Filter")
phraseReplace_Filter = require("phraseReplace_Filter")
pinyinAdding_Filter = require("pinyinAdding_Filter")
dateTime_Filter = require("dateTime_filter")
dynamicPhrase_Filter = require("dynamicPhrase_Filter")
phraseExt_Filter = require("phraseExt_Filter")

👆述脚本,在最后一行中,我们加载了phraseExt_Filter滤镜。

wubi_pinyin.custom.yaml

以上, 我们完成了 phraseExt_Filter 滤镜的所有的功能定义,我们现在需要做的就是在我们的输入方案中配置使用该 phraseExt_Filter 滤镜。此处以五笔・拼音输入方案为例,展示如何配置使用 phraseExt_Filter 滤镜。

五笔・拼音 输入方案的方案文档 wubi_pinyin.schema.yaml 的补丁文档 wubi_pinyin.custom.yaml中,我们增加如下的Filters配置:

# encoding:utf-8
patch:switches/+: #增加以下开关- name: phraseExt				# 候选词扩展开关reset: 1states: [Off, phraseExt]engine/filters:									# 设置以下filter- simplifier- lua_filter@phraseExt_Filter					# 自定义短语滤镜,针对响应的关键字,添加新的选项进来

注意,以上👆配置并不是wubi_pinyin.custom.yaml的全部配置,此处仅展示了与phraseExt_Filter有关的部分。

文档获取

👆以上所述配置文档,你可以在 rime中州韵小狼毫须鼠管输入法 联想词组滤镜配置包.zip 下载取用。

如果你可以访问gitHub,你也可以在 dyyRime 中找到完全版本的配置包。

小结

文章分享了一种在rime中州韵小狼毫须鼠管输入法中配置联想词组滤镜的方法。通过分别在phraseExt commonPhrase.txtphraseExt esAppEmoji.txtphraseExt esUnicode.txtphraseExt personal.txt四个文档中分类整理定义了不同的联想词组,然后在phraseExt_Filter.luaphraseExt_Module.lua两个脚本文档中实现了phraseExt_Filter 滤镜功能。最后以五笔・拼音输入方案为例,展示了如何在 五笔・拼音 输入方案中配置使用 phraseExt_Filter 滤镜的方法,最实现了预期的功能效果。

这篇关于rime中州韵小狼毫 联想词组 滤镜的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/610397

相关文章

2004年 联想员工亲历联想大裁员:公司不是我的家 (网易裁员事件相关文章)

今天,恐怕是联想历史上规模最大的一次大裁员。我们部门9个人,今天送走了三个,还有三个要转岗,剩下三个。整个研究院走了30多人,转岗20多人。这是我经历的第二次所谓战略性调整,有很多感触,却又好像什么都堵在心里,说不出来。干脆简单记录下这段往事,提醒自己。     [联想精细化裁员]      昨天晚上,研究院秘密召开紧急会议。有20多位“责任经理”参加,我才清楚了整个裁员过程。3月6日启动计

【报告分享】联想5G6G技术白皮书-联想(附下载)

摘要:截止到2020年12月,全球共58个国家的135家运营商商用了5G网络和业务,其中126家运营商上线了5G移动业务,48家运营商上线了5G家庭宽带业务。   来源:联想 如需查看完整报告和报告下载或了解更多,微信公众号:行业报告智库

ffmpeg学习十二:滤镜(实现视频缩放,裁剪,水印等)

这篇文章对使用滤镜进行视频缩放,裁剪水印等做简单介绍。 一.滤镜 滤镜可以实现多路视频的叠加,水印,缩放,裁剪等功能,ffmpeg提供了丰富的滤镜,可以使用ffmpeg -filters来查看: Filters: T.. = Timeline support .S. = Slice threading ..C = Command support A = Audio input/out

PHP基于字典树算法实现搜索联想功能

搜索联想功能是各大搜索引擎具备的基础功能,如下图所示,这个功能简化了用户的输入行为,并且能够给用户推荐热门的搜索词,下面我们来讲一下如何用php实现搜索联想的功能。 实现原理 搜索联想功能拆解一下由两部分组成 给定一个查询词,找出以他为前缀的其他目标查询词对目标查询词进行排序,选出权重高的若干个查询词 本篇中重点讲解一下第一部分的实现,这里使用Trie树,也叫字典树,这个数据结构来解决

走出迷茫,发挥联想——让我们来玩PHP吧!

对于学习PHP,本人有个一较为浅显的认知,希望能够帮助一些现阶段处于迷茫期的同学。对于php的学习,就本人的理解来说,我拿它当游戏来做比较,声明一下,不是用编程做游戏,而是拿PHP当作游戏来玩。 小时候,我比较喜欢一些拼装的玩具,和拼图的游戏,到现在我也还是比较喜欢的,算是本人的一个爱好吧,说道这里,很多人可能不理解这和学习PHP有什么关系,不要急下面就是我要说的重点。当我学习PHP的时候,如果我

四十七、openlayers官网示例Image Filters——给地图添加锐化、浮雕、边缘等滤镜效果

官网demo示例: Image Filters 这篇讲的是如何给地图添加滤镜。 一看代码,,好家伙,信息量满满,全都看不懂。。。 咱只能一段一段扒。。。 首先添加一个底图到地图上,这个好理解。 const imagery = new TileLayer({source: new OGCMapTile({url: "https://maps.gnosis.earth/og

自制调色小工具给图片加滤镜,修改图片红、绿、蓝通道及亮度,修改图片颜色

上篇:   上篇我们给地图添加了锐化、模糊等滤镜,这篇来写一个小工具给图片调色。 调色比锐化等滤镜要简单许多,直接拿到像素值修改即可。不需要用到卷积核。。。(*^▽^*) 核心原理就是图像结构,使用context.getImageData获取图像像素结构。 const imageData = context.getImageData(0, 0, canvas.width, ca

CSS基础: css3新特性体验一滤镜和过渡

滤镜filter filter CSS属性性将模糊或者颜色便宜等图形效果应用于元素。 格式: filter: 函数() 函数有很多的如果有兴趣可以看:https://developer.mozilla.org/zh-CN/docs/Web/CSS/CSS_Functions 演示: <!DOCTYPE html><html lang="en"><head><meta charse

联想Lenovo ThinkPad E14加装固态硬盘后无法用U盘重装系统问题

解决办法:想在哪个固态上安装系统就留下哪个固态硬盘,把不安装系统的固态先拔下来。等安装好系统后再装回去,不然U盘启动盘系统无法安装 联想ThinkPad E14原装512GB的系统实在是太小了,最近加装了一条1TB的固态硬盘,速度和容量都比机器自带的强不少,于是想把系统安装在新固态上。 之前用U盘安装过不少系统,这次想着还不简单,以前都是固态一块 + 机械硬盘一块,U盘启动盘安装系统小菜一蝶,

新视野大学英语2 词组 6.17

administration assistant  行政助理 female attorney 女律师 need no personal accommodation whatsoever 无需任何个人住宿 "no personal accommodation whatsoever":没有需要特别注意或调整的个人因素,即没有任何特别的个人便利或特殊对待。