Skip to content
小飞侠
  • 首页
  • 小程序
  • uniapp
  • vue
  • APICloud
  • 其他
菜单

博客

  1. 首页>
  2. 其他>
  3. 各种子词分词方式

各种子词分词方式

  • Post author:xfxia
  • Post published:2023年8月30日
  • Post category:其他


  1. gpt-1用的是

    Byte-Pair-Encoding
  2. bert 与 electra 用的是WordPiece
  3. robert和gpt-2 用的是byte-level Byte-Pair-Encoding [bbpe]
  4. xlnet与albert 用的是SentencePiece



版权声明:本文为ltochange原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
原文链接:https://blog.csdn.net/ltochange/article/details/119958559

你可能也喜欢

关于C++的一些细节[五:函数-基础]

SM4密码算法实现(C语言只使用stdio.h库)

安装Android SDK找不到JDK

C#栈(后进先出)队列实现与解析

Qt简易计算器

Android性能测试

jquery 获取select选中的值和文本

[嵌入式]keil c编译器报warning: #870-D: invalid multibyte character sequence解决办法

区域生长算法的一种C++实现

curl命令显示返回状态码等信息

判断素数并求和用平方根算法(C语言)

【IntelliJ IDEA 2019.2】问题点:error: release version 11 not supported

汇编第六次实验->二进制十六进制bcd码的转换

面向对象的核心概念

Shiro – 登陆验证

请求出现“Content type ‘application/octet-stream‘not supported“错误

Tkinter 7. bind事件

c++11 thread_local

Eclipse+Tomcat+MAVEN+SVN项目完整环境搭建

jQuery grid plung’s Documentation

目录

  • APICloud (3)
  • golang (228)
  • java (8,236)
  • linux (4,002)
  • mysql (2,800)
  • php (1,070)
  • python (5,439)
  • solidity (25)
  • uniapp (235)
  • vue (2,463)
  • 其他 (88,233)
  • 小程序 (801)

文章归档

  • 2023年十二月 (1872)
  • 2023年十一月 (477)
  • 2023年十月 (17371)
  • 2023年九月 (44974)
  • 2023年八月 (26399)
  • 2023年七月 (14793)
  • 2023年六月 (1)
  • 2023年五月 (2186)
  • 2023年四月 (3838)
  • 2023年三月 (1544)
  • 2023年二月 (3)
  • 2023年一月 (4)
  • 2022年十二月 (3)
  • 2022年十一月 (36)
  • 2022年十月 (16)
  • 2022年九月 (8)
  • 2021年九月 (1)
  • 2020年九月 (6)
  • 2020年八月 (5)

标签

Aave (1) cosmos (6) defi (255) flag (27) gitee (1) github (1) golang (234) java (8234) linux命令 (82) List (1) map (1115) mysql (3093) npm (237) tendermint (6) uuid (43) vant (64) vmware (270) 区块链 (63) 合约 (37) 小程序版本更新 (3)
  • 首页
  • 小程序
  • uniapp
  • vue
  • APICloud
  • 其他
Copyright xfxia.com 鲁ICP备19024253号-2
关闭菜单