Skip to main content

Ctrl+K

模型库列表

热门模型介绍
模型库列表

快速开始

安装
文本生成
快速训练
快速推理

飞桨大模型训练

飞桨大模型主文档
大模型-预训练文档
大模型-精调文档
大模型-DPO文档
大模型-RLHF文档
模型融合文档

飞桨大模型推理

Docker快速部署教程
大模型推理教程
实践调优
- 高性能推理最佳实践
- 投机解码教程
静态图模型列表
各个模型推理量化教程
- LLaMA
- Qwen
- DeepSeek
- Mixtral
异构设备推理
大模型-量化教程

飞桨大模型特色技术

飞桨大模型统一存储文档 Unified Checkpoint
灵活注意力掩码 FlashMask
飞桨大模型统一训练器 PaddleNLP Trainer

PaddleNLP工具库

一键预测功能

PaddleNLP 教程

Transformer预训练模型
- ALBERT
- BART
- BERT
- BigBird
- Blenderbot
- Blenderbot-Small
- ChineseBert
- ConvBert
- CTRL
- Deberta
- DebertaV2
- DistilBert
- ELECTRA
- ERNIE
- ERNIE-CTM
- ERNIE-DOC
- ERNIE-GEN
- ERNIE-GRAM
- ERNIE-M
- FNet
- Funnel
- GPT
- LayoutLM
- LayoutLMV2
- LayoutXLM
- Luke
- MBart
- MegatronBert
- MobileBert
- MPNet
- NeZha
- PPMiniLM
- ProphetNet
- Reformer
- RemBert
- RoBERTa
- RoFormer
- SKEP
- SqueezeBert
- T5
- TinyBert
- UnifiedTransformer
- UNIMO
- XLNet
Trainer API训练教程
对话模板教程
多轮对话精调教程
中文情感分析教程
模型压缩教程
数据蒸馏教程
Torch2Paddle 权重转换教程

评价指标

评价指标

实践教程

AI Studio Notebook
大模型预训练新手指南
大模型精调新手指南
大模型对齐新手指南
大模型量化新手指南

进阶指南

模型压缩
大规模分布式训练

社区交流共建

如何贡献模型
如何贡献数据集
- 分享你的数据集
- 创建 DatasetBuilder
如何贡献文档案例
如何加入兴趣小组

FAQ

PaddleNLP 常见问题汇总（持续更新）

API Reference

paddlenlp.data
- collate
- data_collator
- sampler
- tokenizer
- vocab
paddlenlp.datasets
- dataset
paddlenlp.layers
- crf
- sequence
- tcn
paddlenlp.losses
- rdrop
paddlenlp.metrics
- bleu
- chunk
- distinct
- dureader
- glue
- perplexity
- rouge
- sighan
- span
- squad
- utils
paddlenlp.ops
- distributed
  - utils
    
    random
    
    topo
  - parallel
- fast_transformer
  - transformer
    
    decoder
    
    decoding
    
    encoder
    
    fast_transformer
- optimizer
  - adamwdl
  - ema
- einsum
- ext_utils
paddlenlp.seq2vec
- encoder
paddlenlp.taskflow
paddlenlp.trainer
paddlenlp.transformers
- albert
  - modeling
  - tokenizer
- artist
  - modeling
  - tokenizer
- auto
  - modeling
  - tokenizer
- bart
  - modeling
  - tokenizer
- bert
  - modeling
  - tokenizer
- bert_japanese
  - tokenizer
- bigbird
  - modeling
  - tokenizer
- blenderbot
  - modeling
  - tokenizer
- blenderbot_small
  - modeling
  - tokenizer
- chinesebert
  - modeling
  - tokenizer
- codegen
  - modeling
  - tokenizer
- convbert
  - modeling
  - tokenizer
- ctrl
  - modeling
  - tokenizer
- dallebart
  - modeling
  - tokenizer
- deberta
  - modeling
  - tokenizer
- deberta_v2
  - modeling
  - tokenizer
- distilbert
  - modeling
  - tokenizer
- electra
  - modeling
  - tokenizer
- ernie
  - modeling
  - tokenizer
- ernie_ctm
  - modeling
  - tokenizer
- ernie_doc
  - modeling
  - tokenizer
- ernie_gen
  - modeling
- ernie_gram
- ernie_m
  - modeling
  - tokenizer
- fnet
  - modeling
  - tokenizer
- funnel
  - modeling
  - tokenizer
- gau_alpha
  - modeling
  - tokenizer
- gpt
  - modeling
  - tokenizer
- layoutlm
  - modeling
  - tokenizer
- layoutlmv2
  - modeling
  - tokenizer
- layoutxlm
- luke
  - modeling
  - tokenizer
- mbart
  - modeling
  - tokenizer
- megatronbert
  - modeling
  - tokenizer
- mobilebert
  - modeling
  - tokenizer
- mpnet
  - modeling
  - tokenizer
- nezha
  - modeling
  - tokenizer
- opt
  - modeling
- ppminilm
  - modeling
  - tokenizer
- prophetnet
  - modeling
  - tokenizer
- reformer
  - modeling
  - tokenizer
- rembert
  - modeling
  - tokenizer
- roberta
  - modeling
  - tokenizer
- roformer
  - modeling
  - tokenizer
- roformerv2
  - modeling
  - tokenizer
- semantic_search
  - modeling
- skep
  - modeling
  - tokenizer
- squeezebert
  - modeling
  - tokenizer
- t5
  - modeling
  - tokenizer
- tinybert
  - modeling
  - tokenizer
- transformer
  - modeling
- unified_transformer
- unimo
  - modeling
  - tokenizer
- xlm
  - modeling
  - tokenizer
- xlnet
  - modeling
  - tokenizer
- attention_utils
- convert_slow_tokenizer
- distill_utils
- export
- generation_utils
- model_outputs
- model_utils
- optimization
- sentencepiece_model_pb2
- tokenizer_utils
- tokenizer_utils_base
- tokenizer_utils_fast
- utils
paddlenlp.utils
- batch_sampler
- downloader
- env
- file_lock
- import_utils
- log
- profiler
- tools

.rst

tokenizer_utils

tokenizer_utils#

作者： PaddleNLP