Skip to content
小飞侠
  • 首页
  • 小程序
  • uniapp
  • vue
  • APICloud
  • 其他
菜单

博客

  1. 首页>
  2. 其他>
  3. 各种子词分词方式

各种子词分词方式

  • Post author:xfxia
  • Post published:2023年8月30日
  • Post category:其他


  1. gpt-1用的是

    Byte-Pair-Encoding
  2. bert 与 electra 用的是WordPiece
  3. robert和gpt-2 用的是byte-level Byte-Pair-Encoding [bbpe]
  4. xlnet与albert 用的是SentencePiece



版权声明:本文为ltochange原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
原文链接:https://blog.csdn.net/ltochange/article/details/119958559

你可能也喜欢

Log4j日志框架日志输出格式占位符含义

简单复写C++string类

VS+Qt 添加某个功能的图标

购买服务器有系统吗,购买服务器是否带操作系统

序列化

解决8080端口被占用问题

postcss插件开发:全局添加namespace

nginx location 多级目录配置

【动态规划】多重背包问题详解 超详细 总结 dp

C#中Wpf常常会用到的两个基类

C++ 结构体对齐补齐

AltiumDesigne16中对特定焊盘设置铺铜规则

【splay树】hdu 3487

Anaconda找包,安装包时,遇到PackageNotFoundError: ”Package missing in current channels”

nginx配置的常见陷阱及错误

C++ 给vector去重的三种方法

JSP小技巧-tab页

青龙脚本之-聚看点

Selenium学习

IEEE 802.1 Qav 协议的详细总结(时间敏感流的转发和排队增强)

目录

  • APICloud (3)
  • golang (228)
  • java (8,236)
  • linux (4,002)
  • mysql (2,800)
  • php (1,070)
  • python (5,439)
  • solidity (25)
  • uniapp (235)
  • vue (2,463)
  • 其他 (88,233)
  • 小程序 (801)

文章归档

  • 2023年十二月 (1872)
  • 2023年十一月 (477)
  • 2023年十月 (17371)
  • 2023年九月 (44974)
  • 2023年八月 (26399)
  • 2023年七月 (14793)
  • 2023年六月 (1)
  • 2023年五月 (2186)
  • 2023年四月 (3838)
  • 2023年三月 (1544)
  • 2023年二月 (3)
  • 2023年一月 (4)
  • 2022年十二月 (3)
  • 2022年十一月 (36)
  • 2022年十月 (16)
  • 2022年九月 (8)
  • 2021年九月 (1)
  • 2020年九月 (6)
  • 2020年八月 (5)

标签

Aave (1) cosmos (6) defi (255) flag (27) gitee (1) github (1) golang (234) java (8234) linux命令 (82) List (1) map (1115) mysql (3093) npm (237) tendermint (6) uuid (43) vant (64) vmware (270) 区块链 (63) 合约 (37) 小程序版本更新 (3)
  • 首页
  • 小程序
  • uniapp
  • vue
  • APICloud
  • 其他
Copyright xfxia.com 鲁ICP备19024253号-2
关闭菜单