🌺
摘要
详细介绍如何使用 fonttools 将大型中文字体文件压缩为仅包含常用汉字的 WOFF2 格式,大幅减小文件体积。
字体压缩工具使用说明
功能说明
此脚本用于将 xxx.ttf 字体文件压缩,只保留常用的 3500 个汉字,并转换为 WOFF2 格式。
适用场景:
- 网页中文字体加载优化
- 减少字体文件体积,提升页面加载速度
- 保持常用汉字完整性的同时最大化压缩率
使用步骤
1. 安装依赖
pip install -r requirements.txt
或者单独安装:
pip install fonttools brotli
2. 运行脚本
python font_subset.py
3. 输出结果
脚本执行后会生成文件:xxx-subset.woff2
技术细节
包含的字符
- 常用汉字:3500个(基于《现代汉语常用字表》)
- 一级常用字:2500个
- 二级常用字:1000个
- ASCII 字符:
- 数字:
0-9 - 英文字母:
a-z,A-Z - 标点符号和特殊字符
- 空白字符:空格、换行、制表符
- 数字:
预期效果
| 指标 | 数值 |
|---|---|
| 原始文件大小 | 约 14,460 KB (14 MB) |
| 压缩后文件大小 | 预计 200-500 KB |
| 压缩率 | 预计可达 95% 以上 |
处理流程
- 加载原始 TTF 字体文件
- 提取指定的 Unicode 字符集
- 创建字体子集(只保留需要的字符)
- 保存为临时 TTF 文件
- 转换为 WOFF2 格式
- 清理临时文件
- 显示压缩统计信息
注意事项
-
浏览器兼容性:WOFF2 格式在现代浏览器中都有良好支持
- Chrome 36+
- Firefox 39+
- Safari 12+
- Edge 14+
-
自定义字符:如需添加其他特定字符,可以修改
get_common_chinese_characters()函数 -
错误处理:如果转换过程中出现问题,临时的 TTF 文件会被保留用于调试
-
字体质量:子集化后的字体保留了原始的 hinting 信息,确保渲染质量
故障排除
问题 1: 缺少依赖
错误信息:
ModuleNotFoundError: No module named 'fontTools'
解决方案:
pip install -r requirements.txt
问题 2: 权限错误
确保对输出目录有写入权限。
问题 3: 内存不足
对于超大字体文件,可能需要更多内存。可以考虑:
- 分批处理
- 使用更强大的机器
- 增加系统虚拟内存
扩展使用
如果要处理其他字体文件,修改 main() 函数中的路径:
input_font = "你的输入字体路径.ttf"
output_font = "你的输出字体路径.woff2"
完整代码示例
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
"""
字体压缩脚本:从 TTF 字体中提取常用3500汉字并转换为 WOFF2 格式
"""
import sys
import os
from fontTools.ttLib import TTFont
from fontTools.subset import Subsetter, Options
def get_common_chinese_characters():
"""
获取常见的3500个汉字
基于《现代汉语常用字表》的一级常用字(2500字)和二级常用字(1000字)
"""
common_chars = (
"一乙二十丁厂七卜人入八九几儿了力乃刀又三于干亏士工土才寸下大丈与万上小"
"口巾山千乞川亿个勺久凡及夕丸么广亡门义之尸弓己已子卫也女飞刃习叉马乡"
"丰王井开夫天无元专云扎艺木五支厅不太犬区历尤友匹车巨牙屯比互切瓦止少"
"日中冈贝内水见午牛手毛气升长仁什片仆化仇币仍仅斤爪反介父从今凶分乏公"
"仓月氏勿欠风丹匀乌勾凤六文亢方火为斗忆计订户认冗讥心尺引丑巴孔队办以"
"允予劝双书幻玉刊未末示击打巧正扑扒功扔去甘世古节本术可丙左厉右石布龙"
"平灭轧东卡北占业旧帅归且旦目叶甲申叮电号田由史只央兄叼叫另叨叹四生失"
"禾丘付仗代仙们仪白仔他斥瓜乎丛令用甩印乐句匆册犯外处冬鸟务包饥主市立"
"闪兰半汁汇头汉宁穴它讨写让礼训必议讯记永司尼民出辽奶奴加召皮边发孕圣"
"对台矛纠母幼丝式刑动扛寺吉扣考托老执巩圾扩扫地扬场耳共芒亚芝朽朴机权"
"过臣再协西压厌在有百存而页匠夸夺灰达列死成夹轨邪划迈毕至此贞师尘尖劣"
"光当早吐吓虫曲团同吊吃因吸吗屿帆岁回岂刚则肉网年朱先丢舌竹迁乔伟传乒"
"乓休伍伏优伐延件任伤价份华仰仿伙伪自伊血向似后行舟全会杀合兆企众爷伞"
"创肌朵杂危旬旨负各名多争色壮冲冰庄庆亦刘齐交次衣产决充妄闭问闯羊并关"
"米灯州汗污江池汤忙兴宇守宅字安讲军许论农讽设访寻那迅尽导异孙阵阳收阶"
"阴防奸如妇好她妈戏羽观欢买红纤约级纪驰寿弄麦形进戒吞远违运扶抚坛技坏"
"扰拒找批扯址走抄坝贡攻赤折抓扮抢孝均抛投坟抗坑坊抖护壳志扭块声把报却"
"劫芽花芹芬苍芳严芦劳克苏杆杠杜材村杏极李杨求更束豆两丽医辰励否还歼来"
"连步坚旱盯呈时吴助县里呆园旷围呀吨足邮男困吵串员听吩吹呜吧吼别岗帐财"
"针钉牡告我乱利秃秀私每兵估体何佐佑但伸作伯伶佣低你住位伴身皂伺佛囱近"
"彻役返余希坐谷妥含邻岔肝肚肠龟免狂犹角删条卵岛迎饭饮系言冻状亩况床库"
"疗应冷这序辛弃冶忘闲间闷判灶灿弟汪沙汽沃泛沟没沈沉怀忧快完宋宏牢究穷"
"灾良证启评补初社识诉诊词译君灵即层尿尾迟局改张忌际陆阿陈阻附妙妖妨努"
"忍劲鸡驱纯纱纳纲驳纵纷纸纹纺驴纽奉玩环武青责现表规抹拢拔拣担坦押抽拐"
"拖拍者顶拆拥抵拘势抱垃拉拦拌幸招坡披拨择抬其取苦若茂苹苗英范直茄茎茅"
"林枝杯枢柜板松枪构杰述枕丧或画卧事刺枣雨卖矿码厕奔奇奋态欧垄妻轰转软"
"到非叔肯齿些虎虏肾贤尚旺具果味昆国昌畅明易昂典固忠咐呼鸣咏呢岸岩帖罗"
"帜岭凯败贩购图钓制知垂牧物乖刮秆和季委佳侍供使例版侄侦侧凭侨佩货依的"
"迫质欣征往爬彼径所舍金命斧爸采受乳贪念贫肤肺肢肿胀朋股肥服胁周昏鱼兔"
"狐忽狗备饰饱饲变京享店夜庙府底剂郊废净盲放刻育闸闹郑券卷单炒炊炕炎炉"
"沫浅法泄河沾泪油泊沿泡注泻泳泥沸波泼泽治怖性怕怜怪学宝宗定宜审宙官空"
"帘实试郎诗肩房诚衬衫视话诞询该详建肃录隶居届刷屈弦承孟孤陕降限妹姑姐"
"姓始驾参艰线练组细驶织终驻驼绍经贯奏春帮珍玻毒型挂封持项垮挎城挠政赴"
"赵挡挺括拴拾挑指垫挣挤拼挖按挥挪某甚革荐巷带草茧茶荒茫荡荣故胡南药标"
"枯柄栋相查柏柳柱柿栏树要咸威歪研砖厘厚砌砍面耐耍牵残殃轻鸦皆背战点临"
"尝味显冒映星昨畏趴胃贵界虹虾蚁思蚂虽品咽骂哗咱响哈咬咳哪炭峡罚贱贴骨"
"钞钟钢钥钩卸缸拜看矩怎牲选适秒香种秋科重复竿段便俩贷顺修保促侮俭俗俘"
"信皇泉鬼侵追俊盾待律很须叙剑逃食盆胆胜胞胖脉勉狭狮独狡狱狠贸怨急饶蚀"
"饺饼弯将奖哀亭亮度迹庭疮疯疫疤姿亲音帝施闻阀阁差养美姜叛送类迷前首逆"
"总炼炸炮烂剃洁洪洒浇浊洞测洗活派洽染济洋洲浑浓津恒恢恰恼恨举觉宣室宫"
"宪突穿窃客冠语扁袄祖神祝误诱说诵垦退既屋昼费陡眉孩除险院娃姥姨姻娇怒"
"架贺盈勇怠柔垒绑绒结绕骄绘给络骆绝绞统耕耗艳泰珠班素蚕顽盏匪捞栽捕振"
"载赶起盐捎捏埋捉捆捐损都哲逝捡换挽热恐壶挨耻耽恭莲莫荷获晋恶真框桂档"
"桐株桥桃格校核样根索哥速逗栗配翅辱唇夏础破原套逐烈殊殉顾轿较顿毙致柴"
"桌虑监紧党晒眠晓鸭晃晌晕蚊哨哭恩唤啊唉罢峰圆贼贿钱钳钻铁铃铅缺氧特牺"
"造乘敌秤租积秧秩称秘透笔笑笋债借值倚倾倒倘俱倡候俯倍倦健臭射躬息徒徐"
"舰舱般航途拿爹爱颂翁脆脂胸胳脏胶脑狸狼逢留皱饿恋桨浆衰高席准座脊症病"
"疾疼疲效离唐资凉站剖竞部旁旅畜阅羞瓶拳粉料益兼烤烘烦烧烛烟递涛浙涝酒"
"涉消浩海涂浴浮流润浪浸涨烫涌悟悄悔悦害宽家宵宴宾窄容宰案请朗诸读扇袜"
"袖袍被祥课谁调冤谅谈谊剥恳展剧屑弱陵陶陷陪娱娘通能难预桑绢绣验继球理"
"捧堵描域掩捷排掉堆推掀授教掏掠培接控探据掘职基著勒黄萌萝菌菜萄菊萍菠"
"营械梦梢梅检梳梯桶救副票戚爽聋袭盛雪辅辆虚雀堂常匙晨睁眯眼悬野啦晚啄"
"距跃略蛇累唱患唯崖崭崇圈铜铲银甜梨犁移笨笼笛符第敏做袋悠偿偶偷您售停"
"偏假得衔盘船斜盒鸽悉欲彩领脚脖脸脱象够猜猪猎猫猛馅馆凑减毫麻痒痕廊康"
"庸鹿盗章竟商族旋望率着盖粘粗粒断剪兽清添淋淹渠渐混渔淘液淡深婆梁渗情"
"惜惭悼惧惕惊惨惯寇寄宿窑密谋谎祸谜逮敢屠弹随蛋隆隐婚婶颈绩绪续骑绳维"
"绵绸绿琴斑替款堪搭塔越趁趋超提堤博揭喜插揪搜煮援裁搁搂搅握揉斯期欺联"
"散惹葬葛董葡敬葱落朝辜葵棒棋植森椅椒棵棍棉棚棕惠惑逼厨厦硬确雁殖裂雄暂"
"雅辈悲紫辉敞赏掌晴暑最量喷晶喇遇喊景践跌跑遗蛙蛛蜓喝喂喘喉幅帽赌赔黑"
"铸铺链销锁锄锅锈锋锐短智毯鹅剩等程稀税筐等筑策筛筒答筋筝傲傅牌堡集焦"
"傍储皓皖粤奥街惩御循艇舒番释禽腊脾腔鲁猾猴然馋装蛮就痛童阔善羡普粪尊"
"道曾焰港湖渣湿温渴滑湾渡游滋溉愤慌惰愧愉慨割寒富窜窝窗遍裕裤裙谢谣谦"
"属屡强粥疏隔隙絮嫂登缎缓编骗缘瑞魂肆摄摸填搏塌鼓摆携搬摇搞塘摊蒜勤鹊"
"蓝墓幕蓬蓄蒙蒸献禁楚想槐榆楼概赖酬感碍碑碎碰碗碌雷零雾雹输督龄鉴睛睡"
"睬鄙愚暖盟歇暗照跨跳跪路跟遣蛾蜂嗓置罪罩错锡锣锤锦键锯矮辞稠愁筹签简"
"毁舅鼠催傻像躲微愈遥腰腥腹腾腿触解酱痰廉新韵意粮数煎塑慈煤煌满漠源滤"
"滥滔溪溜滚滨粱滩慎誉塞谨福群殿辟障嫌嫁叠缝缠静碧璃墙撇嘉摧截誓境摘摔"
"聚蔽慕暮蔑模榴榜榨歌遭酷酿酸磁愿需弊裳颗嗽蜻蜡蝇蜘赚锹锻舞稳算箩管僚"
"鼻魄貌膜膊膀鲜疑馒裹敲豪膏遮腐瘦辣竭端旗精歉熄熔漆漂漫滴演漏慢寨赛察"
"蜜谱嫩翠熊凳骡缩慧撕撒趣趟撑播撞撤增聪鞋蕉蔬横槽樱橡飘醋醉震霉瞒题暴"
"瞎影踢踏踩踪蝶蝴嘱墨靠赞疆藏瞧霜霞颤懂憾避邀翼礁藏籍魔灌蠢霸露囊罐"
)
return set(common_chars)
def subset_font(input_font_path, output_font_path, characters):
"""
对字体进行子集化处理,只保留指定字符
"""
print(f"正在加载字体: {input_font_path}")
font = TTFont(input_font_path)
options = Options()
options.name_legacy = True
options.name_ids = '*'
options.hinting = True
subsetter = Subsetter(options=options)
unicode_list = [ord(char) for char in characters]
ascii_chars = (
"0123456789"
"abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ"
" !\"#$%&'()*+,-./:;<=>?@[\\]^_`{|}~"
"\n\r\t"
)
unicode_list.extend([ord(char) for char in ascii_chars])
print(f"正在处理 {len(unicode_list)} 个字符...")
subsetter.populate(unicodes=unicode_list)
subsetter.subset(font)
temp_ttf_path = output_font_path.replace('.woff2', '_temp.ttf')
print(f"正在保存临时 TTF 文件: {temp_ttf_path}")
font.save(temp_ttf_path)
font.close()
print("正在转换为 WOFF2 格式...")
try:
ttf_font = TTFont(temp_ttf_path)
ttf_font.flavor = 'woff2'
ttf_font.save(output_font_path)
ttf_font.close()
print(f"成功生成 WOFF2 文件: {output_font_path}")
os.remove(temp_ttf_path)
print("已清理临时文件")
except Exception as e:
print(f"转换 WOFF2 时出错: {e}")
print(f"临时 TTF 文件保留在: {temp_ttf_path}")
raise
def main():
# 修改为你的字体文件路径
input_font = "/path/to/your/xxx.ttf"
output_font = "/path/to/output/xxx-subset.woff2"
print("=" * 60)
print("字体压缩工具 - 提取常用3500汉字并转换为 WOFF2")
print("=" * 60)
characters = get_common_chinese_characters()
print(f"常用汉字数量: {len(characters)}")
try:
subset_font(input_font, output_font, characters)
original_size = os.path.getsize(input_font)
compressed_size = os.path.getsize(output_font)
print("\n" + "=" * 60)
print("压缩结果:")
print(f"原始文件大小: {original_size / 1024:.2f} KB")
print(f"压缩后文件大小: {compressed_size / 1024:.2f} KB")
print(f"压缩率: {(1 - compressed_size / original_size) * 100:.2f}%")
print("=" * 60)
except Exception as e:
print(f"\n错误: {e}")
import traceback
traceback.print_exc()
sys.exit(1)
if __name__ == "__main__":
main()
总结
通过字体子集化技术,我们可以将大型中文字体文件(14 MB)压缩到仅 200-500 KB,压缩率高达 95% 以上。这对于网页性能优化有着重要意义:
主要优势:
- ✅ 大幅减少字体文件体积
- ✅ 提升页面加载速度
- ✅ 降低带宽消耗
- ✅ 保持常用汉字完整性
使用建议:
- 根据实际需求选择合适的字符集
- 定期更新常用字表以覆盖更多场景
- 考虑提供 fallback 字体以应对生僻字
- 结合 CDN 和缓存策略进一步优化
希望这个工具能帮助你优化网站的字体加载性能!
文章发表于 2026/05/20 21:36
评论
加载中...