Pytorch使用全局编码(Global-Encoding)生成文本摘要(北大开源)

Song1449 次浏览0个评论2019年03月14日

Global-Encoding

此项目主要是为了实现论文Global Encoding for Abstractive Summarization

一、要求

  • Ubuntu 16.0.4
  • Python 3.5
  • Pytorch 0.4.1(更新)
  • pyrouge 要使用pyrouge,请使用以下行设置rouge路径:
pyrouge_set_rouge_path RELEASE-1.5.5/

似乎有些用户遇到了pyrouge的问题,所以我更新了脚本,用户可以将目录RELEASE-1.5.5放在你的主目录中并设置路由路径(或运行命令chmod 777 RELEASE-1.5.5获得系统权限)。

二、预处理

python3 preprocess.py -load_data path_to_data -save_data path_to_store_data 

记得将数据放入一个文件夹,并将它们命名为train.srctrain.tgtvalid.srcvalid.tgttest.srctest.tgt,并在其中创建一个名为data的新文件夹

三、训练

python3 train.py -log log_name -config config_yaml -gpus id

为超参数设置创建自己的yaml文件。

四、评估

python3 train.py -log log_name -config config_yaml -gpus id -restore checkpoint -mode eval

五、引文

如果您将此代码用于研究,请引用我们的论文:

@inproceedings{globalencoding,
  title     = {Global Encoding for Abstractive Summarization},
  author    = {Junyang Lin and Xu Sun and Shuming Ma and Qi Su},
  booktitle = {{ACL} 2018},
  year      = {2018}
}

原文地址:Pytorch使用全局编码(Global-Encoding)生成文本摘要(北大开源)

提交评论

请登录后评论

用户评论

    当前暂无评价,快来发表您的观点吧...

更多相关好文

    当前暂无更多相关好文推荐...