conllutoolkit package¶
Submodules¶
conllutoolkit.base module¶
conllutoolkit.convert module¶
-
conllutoolkit.convert.conllu_to_semeval16(conllu_filename, semeval16_filename)¶ 将conllu格式的数据转化为semeval16使用的原始数据格式 强烈建议使用标准的conllu格式保存语义/句法依存结果,semeval16使用的原始数据格式对数据处理并不友好 conlluprocessor的方法基于标准的conllu格式编写,处理semeval格式时会出现错误!
- Parameters
conllu_filename (
str) – conllu格式文件semeval16_filename (
str) – 输出的semeval16格式文件
- Return type
None- Returns
无返回值
-
conllutoolkit.convert.semeval16_to_conllu(semeval16_filename, conllu_filename)¶ 将semeval16使用的原始数据格式转换为标准的conllu格式 强烈建议使用标准的conllu格式保存语义/句法依存结果,semeval16使用的原始数据格式对数据处理并不友好 conlluprocessor的方法基于标准的conllu格式编写,处理semeval格式时会出现错误!
- Parameters
semeval16_filename (
str) – semeval16格式的文件conllu_filename (
str) – 输出的conllu格式文件
- Return type
None- Returns
无返回值
conllutoolkit.find module¶
conllutoolkit.future module¶
-
conllutoolkit.future.generate_raw_conllu(raw_sentences, output_file)¶ 将生语料转化为conllu格式(未实现)
- Parameters
raw_sentences –
output_file –
Returns:
-
conllutoolkit.future.word_dependency2char_dependency(conllu_file_or_data, output_file)¶ 词语基本依存转化为字符级别依存(未实现)
- Parameters
conllu_file_or_data –
output_file –
Returns: