Skip to content
小飞侠
  • 首页
  • 小程序
  • uniapp
  • vue
  • APICloud
  • 其他
菜单

博客

  1. 首页>
  2. 其他>
  3. 各种子词分词方式

各种子词分词方式

  • Post author:xfxia
  • Post published:2023年8月30日
  • Post category:其他


  1. gpt-1用的是

    Byte-Pair-Encoding
  2. bert 与 electra 用的是WordPiece
  3. robert和gpt-2 用的是byte-level Byte-Pair-Encoding [bbpe]
  4. xlnet与albert 用的是SentencePiece



版权声明:本文为ltochange原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
原文链接:https://blog.csdn.net/ltochange/article/details/119958559

你可能也喜欢

现代通信原理6.2:单边带(SSB)调制

IPC机制之管道

c语言实现 顺序存储和链式存储(几种链表)

sp_helpdb

sentinel流控模式

输入20个整数,输出它们的和及平均值

收集邮票(概率期望 + dp)

@RequestMapping注解详解

vs2015(或vs2017) 不能新建C++项目

虚拟化系列-VMware vSphere 5.1 虚拟机管理

TortoiseGit 文件夹状态图标不显示解决方式

easy_captcha算术验证码请求与验证,只保留“+”,“*”

yml配置文件简单语法及小坑

帆软报表自定义分页傻瓜式学习

textcnn自己的理解

getline和gets和cin.getline

使用toggle()方法进行显示隐藏

网络编程—TCP、UDP编程

Error running ****AdminApplication. Command line is too long. Shorten the command line via JAR man

js的面向对象

目录

  • APICloud (3)
  • golang (228)
  • java (8,236)
  • linux (4,002)
  • mysql (2,800)
  • php (1,070)
  • python (5,439)
  • solidity (25)
  • uniapp (235)
  • vue (2,463)
  • 其他 (88,233)
  • 小程序 (801)

文章归档

  • 2023年十二月 (1872)
  • 2023年十一月 (477)
  • 2023年十月 (17371)
  • 2023年九月 (44974)
  • 2023年八月 (26399)
  • 2023年七月 (14793)
  • 2023年六月 (1)
  • 2023年五月 (2186)
  • 2023年四月 (3838)
  • 2023年三月 (1544)
  • 2023年二月 (3)
  • 2023年一月 (4)
  • 2022年十二月 (3)
  • 2022年十一月 (36)
  • 2022年十月 (16)
  • 2022年九月 (8)
  • 2021年九月 (1)
  • 2020年九月 (6)
  • 2020年八月 (5)

标签

Aave (1) cosmos (6) defi (255) flag (27) gitee (1) github (1) golang (234) java (8234) linux命令 (82) List (1) map (1115) mysql (3093) npm (237) tendermint (6) uuid (43) vant (64) vmware (270) 区块链 (63) 合约 (37) 小程序版本更新 (3)
  • 首页
  • 小程序
  • uniapp
  • vue
  • APICloud
  • 其他
Copyright xfxia.com 鲁ICP备19024253号-2
关闭菜单