Flair:一个非常简单的pytorch框架,用于最先进的NLP
Song •
1937 次浏览 •
0个评论 •
2018年08月21日
一个非常简单的框架,用于最先进的NLP
。由Zalando Research开发。
Flair是什么:
- 强大的语法 - 语义标记器/分类器。
Flair
允许您应用我们最先进的模型进行命名实体识别(NER),词性标注(PoS),帧感消歧,分块和分类到您的文本。 - 文本嵌入库。
Flair
具有简单的界面,允许您使用和组合不同的单词和文档嵌入。特别是,您可以尝试我们提出的上下文字符串嵌入来构建您自己最先进的NLP
方法。 - Pytorch NLP框架。 我们的框架直接在
Pytorch
上构建,使您可以轻松地训练自己的模型,并使用Flair
嵌入和类来尝试新方法。
现在版本0.2.0!
与现有技术的比较
Flair
优于以前在一系列NLP
任务上的最佳方法:
任务 | 数据集 | 我们的结果 | 以前最好的 |
---|---|---|---|
命名实体识别(英文) | Conll-03 | 93.09(F1) | 92.22 (Peters等,2018) |
命名实体识别(英文) | Ontonotes | 89.71(F1) | 86.28 (Chiu等,2016) |
Emerging实体检测(英文) | WNUT-17 | 50.20(F1) | 45.55 (Aguilar等,2018) |
命名实体识别(德语) | Conll-03 | 88.32(F1) | 78.76 (Lample等,2016) |
命名实体识别(德语) | Germeval | 84.65(F1) | 79.08 ( Hänig 等,2014) |
词性标注 | WSJ | 97.85 | 97.64 (崔,2016) |
Chunking | Conll-2000 | 96.72(F1) | 96.36 (Peters等,2017) |
以下是使用Flair复制这些数字的方法。您还可以在我们的论文中找到详细的评估和讨论:
Contextual String Embeddings for Sequence Labeling。Alan Akbik,Duncan Blythe和Roland Vollgraf。第27届计算语言学国际会议,COLING 2018。
快速开始
1、环境需求和安装
该项目基于PyTorch 0.4+
和Python 3.6+
,因为签名方法和类型提示很漂亮。如果您没有Python 3.6
,需要提前安装。这是Ubuntu 16.04安装python 3.6的方法。然后,在您最喜欢的虚拟环境中使用pip
安装即可:
pip install flair
2、示例用法
让我们对一个例句运行命名实体识别(NER)。您需要做的就是创建一个Sentence
,加载预先训练的模型并使用它来预测句子的标签:
from flair.data import Sentence
from flair.models import SequenceTagger
# make a sentence
sentence = Sentence('I love Berlin .')
# load the NER tagger
tagger = SequenceTagger.load('ner')
# run NER over sentence
tagger.predict(sentence)
完成!在Sentence
目前拥有实体的注解。打印sentence
可以看到标记器找到的内容。
print(sentence)
print('The following NER tags are found:')
print(sentence.to_tagged_string())
应该会输出:
Sentence: "I love Berlin ." - 4 Tokens
The following NER tags are found:
I love Berlin <S-LOC> .
教程
我们提供了一套快速教程来帮助您开始使用该库:
- 教程1:基础知识
- 教程2:标记文本
- 教程3:使用Word Embeddings
- 教程4:使用Embeddings文档
- 教程5:训练自己的模型
- 教程6:训练您自己的Embeddings
这些教程解释了基础的
NLP
类是如何工作,如何加载预先训练的模型来标记文本,如何使用不同的单词或文档嵌入嵌入文本,以及如何训练自己的语言模型,序列标记模型和文本分类模型。
用户评论
当前暂无评价,快来发表您的观点吧...
更多相关好文
当前暂无更多相关好文推荐...
-
微信公众号文章/菜单添加小程序时路径如何获取? 2021-12-22
-
如何轻松获取微信小程序路径path? 2021-12-22
-
cannot import name 'CUDA_HOME' from 'mmcv.utils' 2021-12-05
-
vgg的loss一轮达到ln(1/n)阈值,如何解决 2021-11-21
-
如何下载使用utils库 2021-10-27
热门文章
-
微信公众号文章/菜单添加小程序时路径如何获取? 2021-12-22
-
如何轻松获取微信小程序路径path? 2021-12-22
-
python/MySQL分页查询方法与性能优化 2021-06-23
-
mitmproxy & python 忽略所有的https/ssl请求 2021-04-19
-
如何使用邮件/邮箱推广微信公众号/小程序? 2021-01-28
栏目最新文章
公告提示
- pytorch中文文档
- pytorch官方文档
提交评论