功能定位:为什么必须学会“导出并迁移”
在 2026 年 2 月版搜狗输入法里,自定义短语已支持跨端同步 2.0,但“云端合并”并非 100% 可靠:企业防火墙拦截、账号多地登录冲突、鸿蒙 NEXT 原生版缓存策略差异,都会导致短语缺失。学会本地完整导出,相当于给自己留一份可回滚的冷备份,在换机、重装系统、降级版本时能把 3 000 条客服话术、1 200 条地址模板一次搬过去,而不用重新敲一遍。
经验性观察显示,云端同步在每日 20:00—23:00 高峰时段最容易出现“部分词条延迟 6–12 h”现象;若你恰在此时换机,极易误以为数据丢失。提前导出本地文件,可在无网络环境下 30 秒内完成还原,把业务中断时间压到最低。
变更脉络:三个版本带来的差异
1) PC 13.9.0.7007(2026-01-20)把短语文件从旧的 phrases.ini 改为 userPhrase.db,SQLite 格式,支持 2 万条上限。
2) 手机 12.6.3(2026-02-01)新增“跨端同步 2.0”,默认只拉取最近 30 天内有触发记录的短语,冷僻条目会被滞留在旧设备。
3) 鸿蒙 NEXT 原生版因调用方舟图形引擎,暂不支持“设置-属性设置-高级-自定义短语”界面,只能走账号同步或手动替换 db 文件。
除了上述显性差异,13.9 版在数据库表内新增 timestamp 字段,用于记录每条短语的“最后触发时间”。这意味着,如果你曾在旧版手动改库,新增字段缺失会导致导入直接被拒绝并报“数据损坏”。升级前做一次原生导出,可让字段补齐,避免版本脚本报错。
完整导出:Windows 桌面端最短路径
1. 图形界面导出(推荐新手)
- 右键状态栏皮肤 → 设置属性 → 高级 → 自定义短语 → 导出。
- 在弹窗里勾选“带分类标签”(13.9 版新增),否则后续导入会丢失分组。
- 选择保存路径,文件名建议带日期,如
sg短语_20260224.txt,编码默认 UTF-16LE,不要改,否则手机端识别乱码。
提示:如果你曾开启“隐私离线模式”,导出时系统会提示“离线短语不会包含云端热词”,这属于预期行为,无需关闭离线模式再导。
2. 文件级冷备份(进阶)
关闭搜狗进程 → 打开 %AppData%\SogouPY\users\你的账号\ → 复制 userPhrase.db 与 userPhrase_bak.db 到加密 U 盘。还原时先退出账号同步,再覆盖文件,重新登录即可强制拉取本地版本,避免云端合并冲掉冷备份。
示例:在 Win11 22H2 上,如果进程残留导致文件被占用,可用 taskkill /f /im SogouCloud.exe 强制结束,再做复制;否则会出现“db 正在被另一进程使用”而无法覆盖的提示。
完整导出:Android / iOS 端路径
Android 12.6.3 及以下
- 进入搜狗输入法 App → 我的 → 设置 → 词库与短语 → 自定义短语 → 右上角 ⋮ → 导出。
- 系统会生成
SGPhrase_日期.txt存到/sdcard/Sogou/PhraseBackup/,微信/QQ 可直接分享。
iOS 12.6.3 受限说明
因沙箱机制,iOS 版无本地导出按钮,只能走:设置 → 词库与短语 → 自定义短语 → 同步到云端,然后在 PC 端登录同一账号,用“云端短语下载”转存为 txt,再回传 iPhone。经验性观察:iOS 端若关闭“允许完全访问”,同步会失败,需临时开启。
进一步补充:iOS 回传文件时,用“文件”App 接收后务必选择“复制到搜狗输入法”,系统才会把文件放入沙箱内的 Inbox 目录;否��在导入列表里看不到待选文件。
跨端迁移:Windows → 安卓实战
场景:客服主管 阿莉 要把 4 800 条话术从办公电脑迁到三星折叠屏,供在外出差时使用。
- 在 PC 端按上文导出
sg短语_20260224.txt。 - 把文件丢进企业微信“文件传输助手”,手机端下载后不要直接点击,以免被微信改编码。
- 打开搜狗输入法 App → 词库与短语 → 自定义短语 → ⋮ → 导入 → 选中该 txt → 勾选“遇重名覆盖”。
- 导入完成重启键盘,在任意输入框键测试缩写
khfw,应能秒出“客户您好,请问有什么可以帮您?”。
注意:安卓端若开启“局域网直传”,会与导入流程抢占文件句柄,导致 0 条成功。临时关闭路径:设置 → 跨端同步 → 局域网直传,导入完再打开即可。
跨端迁移:安卓 → iPhone 的折中方案
由于 iOS 无法直导 txt,只能借助 PC 做“跳板”:
- 安卓端导出 txt → 发送��� PC。
- PC 端登录同一搜狗账号 → 设置属性 → 高级 → 自定义短语 → 导入,此时短语进入云端队列。
- iPhone 打开搜狗输入法 → 我的 → 设置 → 词库与短语 → 自定义短语 → 同步,等待提示“已更新 4 800 条”。
经验性观察:若账号在 24 小时内于 5 台设备来回登录,云端会触发“频繁同步保护”,需要等 30 min 冷却。
补充技巧:冷却期内可临时切换飞行模式再进入自定义短语界面,客户端会读取本地缓存,先完成离线验证,待联网后再自动合并,减少等待焦虑。
鸿蒙 NEXT 原生版:无界面情况下的手动替换
鸿蒙 NEXT 目前(2026-02)未开放图形入口,只能替换 db 文件:
- 在 PC 端导出并转成 db:把 txt 导入 PC 端后,
userPhrase.db即是最新版。 - 手机插电脑 → 文件管理 →
/data/data/com.sohu.inputmethod.sogou/files/database/→ 覆盖userPhrase.db(需 root 或 adb 权限)。 - 覆盖后强制停止搜狗输入法 → 重新打开,即可加载。
警告:鸿蒙系统对 db 文件有签名校验,直接覆盖可能导致键盘闪退。缓解:提前用
sqlite3打开原 db,把user_phrase表清空后,再执行.import批量插入,可绕过校验。![]()
鸿蒙 NEXT 原生版:无界面情况下的手动替换
例外与取舍:哪些短语不建议迁移
- 带公司敏感信息的客服快捷语:若目标设备为私人手机,迁移后可能被第三方 App 读取剪贴板,合规风险高。
- 旧版本“宏替换”语法:如
%Date%、%ClipBoard%,在 12.6.3 移动端已被废弃,导入后只会原样输出字符。 - 超过 2 万条上限:13.9 版 db 单表上限 20 000 行,超出部分在导入时会被静默截断,无错误提示。
此外,带 HTML 标签的富文本短语(如 <font color=red>)在移动端会被转义,最终上屏的是纯文本标签,达不到彩色效果,建议提前清洗。
故障排查:导入 0 条、乱码、缺失分组
| 现象 | 可能原因 | 验证方法 | 处置 |
|---|---|---|---|
| 导入后显示 0 条 | 编码被微信改成 UTF-8 | 用 Notepad++ 查看编码 | 重新转 UTF-16LE 再导 |
| 分组丢失 | 导出时未勾选“带分类标签” | 查看 txt 首行是否有 #分组名 | 重新导出并勾选 |
| 鸿蒙闪退 | db 签名校验失败 | adb logcat | grep sogou | 用 sqlite3 清空表再插入 |
适用/不适用场景清单
适用
- 客服、运营、法务等高频重复话术岗位,短语量 500~15 000 条。
- 需要定期重装系统的游戏代练,避免每次重新敲开团指令。
- 地方政务窗口使用四川话语音输入,需同步方言缩写。
不适用
- 涉密内网终端(无 USB、无 adb)无法把 db 文件拷出。
- 临时借用设备,导入后忘记删除,导致个人词库泄露。
- 短语文本含
%PATH%等环境变量,在移动端会被当成普通字符。
最佳实践 6 条检查表
- 导出前先在原设备随机抽检 10 条缩写,确认能正常上屏。
- txt 文件命名带日期+平台,如
sgWin_20260224.txt,方便版本回退。 - 跨端迁移时,先关闭“局域网直传”与“云端合并”,减少句柄冲突。
- 导入后立刻重启键盘,并在备忘录输入
test检查默认候选是否被顶掉。 - 2 万条以上拆分为 5 000 条/文件,分批导,观察是否触发上限截断。
- 敏感短语用“加密压缩包+随机密码”传输,避免微信云端留痕。
版本差异与未来预期
经验性观察,搜狗内部测试版 14.0 已把短语上限提升到 5 万条,并支持“短语版本号”冲突回退,预计在 2026 年 Q3 进入正式通道。届时导入界面会增加“差异合并预览”,可减少覆盖误伤。若你现在就拥有 3 万条以上需求,建议先使用 PC 端 db 冷备份,等 14.0 上线后一次性迁移,避免中间版本反复导出的编码损耗。
收尾结论
“搜狗输入法如何完整导出并迁移自定义短语”看似只是备份小事,却在跨设备、跨系统、跨版本时暗藏编码、校验、上限三条暗线。掌握UTF-16LE 编码校验、db 签名校验、2 万条上限这三把尺子,再配合“导出-冷备份-分端导入-重启验证”四步流程,就能在换机、重装、鸿蒙升级时实现零丢失迁移。下次再遇到客服话术、地址模板、游戏指令全清空,就不必熬夜重敲,5 分钟就能满血复活。
常见问题
导出时提示“编码不匹配”如何处理?
用 Notepad++ 打开文件,确认底部状态栏显示“UTF-16LE”。若被微信或邮件改为 UTF-8,可在菜单栏选择“编码→转换为UTF-16LE”,另存后重新导入即可。
iOS 端导入后分组全部消失?
PC 端导出时务必勾选“带分类标签”,并在 txt 首行看到 #分组名。若缺失,可回 PC 重新导出,再经云端同步至 iOS。
鸿蒙覆盖 db 后键盘闪退怎么办?
使用 adb 拉回原 db,用 sqlite3 清空 user_phrase 表后,再执行 .import 逐条插入,可绕过签名校验;完成后重启输入法即可恢复。
超过 2 万条会被截断,有提示吗?
导入过程无任何弹窗,只在日志写入“Reach single table limit”。建议分批导入,每批 ≤15 000 条,并核对条数。
局域网直传已关闭仍导入 0 条?
部分三星/小米机型自带“互传联盟”服务也会占用句柄,需在系统设置里暂停“附近共享”或“快速共享”,再重新导入。
