欢迎使用PaddleNLP

PaddleNLP 2.0 是基于飞桨的文本领域核心库,具备 易用的文本领域API多场景的应用示例、和 高性能分布式训练 三大特点,旨在提升飞桨开发者文本领域建模效率,并提供基于飞桨核心框架2.0的NLP任务最佳实践。

  • 易用的文本领域API

    • 提供从数据集加载、文本预处理、模型组网、模型评估、到推理加速的领域API:如一键加载中文数据集的 Dataset API,可灵活高效地完成数据预处理的Data API,预置60+预训练词向量的 Embedding API; 提供50+预训练模型的生态基础能力的 Transformer API,可大幅提升NLP任务建模和迭代的效率。

  • 多场景的应用示例

    • PaddleNLP 2.0提供多粒度多场景的应用示例,涵盖从NLP基础技术、NLP核心技术、NLP系统应用以及文本相关的拓展应用等。全面基于飞桨2.0全新API体系开发,为开发提供飞桨2.0框架在文本领域的最佳实践。

  • 高性能分布式训练

    • 基于飞桨核心框架『动静统一』的特性与领先的自动混合精度优化策略,通过分布式Fleet API可支持超大规模参数的4D混合并行策略,并且可根据硬件情况灵活可配,高效地完成超大规模参数的模型训练。

评价指标

Indices and tables