conllutoolkit package

Submodules

conllutoolkit.base module

conllutoolkit.convert module

conllutoolkit.convert.conllu_to_semeval16(conllu_filename, semeval16_filename)

将conllu格式的数据转化为semeval16使用的原始数据格式 强烈建议使用标准的conllu格式保存语义/句法依存结果,semeval16使用的原始数据格式对数据处理并不友好 conlluprocessor的方法基于标准的conllu格式编写,处理semeval格式时会出现错误!

Parameters
  • conllu_filename (str) – conllu格式文件

  • semeval16_filename (str) – 输出的semeval16格式文件

Return type

None

Returns

无返回值

conllutoolkit.convert.semeval16_to_conllu(semeval16_filename, conllu_filename)

将semeval16使用的原始数据格式转换为标准的conllu格式 强烈建议使用标准的conllu格式保存语义/句法依存结果,semeval16使用的原始数据格式对数据处理并不友好 conlluprocessor的方法基于标准的conllu格式编写,处理semeval格式时会出现错误!

Parameters
  • semeval16_filename (str) – semeval16格式的文件

  • conllu_filename (str) – 输出的conllu格式文件

Return type

None

Returns

无返回值

conllutoolkit.find module

conllutoolkit.future module

conllutoolkit.future.generate_raw_conllu(raw_sentences, output_file)

将生语料转化为conllu格式(未实现)

Parameters
  • raw_sentences

  • output_file

Returns:

conllutoolkit.future.word_dependency2char_dependency(conllu_file_or_data, output_file)

词语基本依存转化为字符级别依存(未实现)

Parameters
  • conllu_file_or_data

  • output_file

Returns:

conllutoolkit.split module

conllutoolkit.statistic module

conllutoolkit.type module

Module contents