zl程序教程

您现在的位置是:首页 >  后端

当前栏目

Python代码库之解析unicode部首

Python代码 解析 Unicode
2023-09-11 14:18:47 时间
import sqlite3
import json
import os

'''
from cjk import *
dbname='cjk_kangxi_bushou.db'
filepath='Unihan12/a.txt'
paraList=u2para(filepath)
mdx2db(dbname,paraList)
'''

def u2para(filepath):
    filelist=[]
    realist=[]
    paralist=[]
    for line in open(filepath): 
        filelist.append(line) 
    for item in filelist: 
        item=item.replace('\n','').strip()
        if item  == '': continue 
        if item[0] == '#' : continue 
        realist.append(item) 

    for  item in realist:
        slist=item.split(';')
        cjk_id=slist[0].strip()
        cjk_code=slist[1].strip()
        cjk_uni=slist[2].strip()
        mkey=u2w(cjk_uni)
        paralist.append((cjk_id,cjk_code,cjk_uni,mkey))

    print('filelist',len(filelist))
    print('realist',len(realist))
    print(