搜集、整理、发布 中文 自然语言处理 语料/数据集,与 有志之士 共同 促进 中文 自然语言处理 的 发展。
中文自然语言处理数据集,平时做做实验的材料。欢迎补充提交合并。
A curated list of resources for Chinese NLP 中文自然语言处理相关资料
#自然语言处理#大规模中文自然语言处理语料 Large Scale Chinese Corpus for NLP
Datasets, SOTA results of every fields of Chinese NLP
翻译 - 中国自然语言处理各领域的数据集,SOTA结果
#自然语言处理#Awesome Pretrained Chinese NLP Models,高质量中文预训练模型&大模型&多模态模型&大语言模型集合
Collections of Chinese NLP corpus
中文医学NLP公开资源整理:术语集/语料库/词向量/预训练模型/知识图谱/命名实体识别/QA/信息抽取/模型/论文/etc
谷歌自然语言处理模型BERT:论文解析与python代码
An collection of Chinese nlp corpus including basic Chinese syntatic wordset, semantic wordset, historic corpus and evaluate corpus. 中文自然语言处理的语料集合,包括语义词、领域共时、历时语料库、评测语料库等。
Go efficient multilingual NLP and text segmentation; support English, Chinese, Japanese and others.
翻译 - Go efficient text segmentation @vcaesar; support english, chinese, japanese and other. Go 语言高性能分词
Simple implementations of NLP models. Tutorials are written in Chinese on my website https://mofanpy.com
《Rasa实战:构建开源对话机器人》官方随书代码 | The official source code of Rasa in Action: Building Open Source Conversational AI
Oxford Deep NLP 2017 course
Data repository for pretrained NLP models and NLP corpora.
Data augmentation for NLP
NLP Paper
NLP DNN Toolkit - Building Your NLP DNN Models Like Playing Lego
翻译 - NLP DNN工具包-像玩乐高游戏一样建立NLP DNN模型
本项目爬取各省市政府工作报告,试图通过聚类、主题分类等将它们识别区分开来。
Persian NLP Toolkit