当前位置: 首页 > news >正文

博览局网站建设广州seo公司排行

博览局网站建设,广州seo公司排行,张雪峰谈建筑室内设计,自己做投票网站怎么弄一、下载 bert-base-chinese镜像下载 二、简介作用: 模型每个参数占用的字节大小模型大小模型大小层数头数GPT-14 个字节的 FP32 精度浮点数117M446MB1212GPT-22 个字节的 FP161.5亿到1.75亿0.5GB到1.5GB4816GPT-32 个字节的 FP161.75万亿(17500亿&a…

一、下载 

bert-base-chinese镜像下载

二、简介作用:

模型每个参数占用的字节大小模型大小模型大小层数头数
GPT-14 个字节的 FP32 精度浮点数117M446MB1212
GPT-22 个字节的 FP161.5亿到1.75亿0.5GB到1.5GB4816
GPT-32 个字节的 FP161.75万亿(17500亿)350GB17596个头

BERT(Bidirectional Encoder Representations from Transformers)

针对中文语言,HuggingFace 团队推出了 bert-base-chinese 模型,提供语言处理能力。

Transformers提供两大类的模型架构,一类用于语言生成NLG任务,比如GPT、GPT-2、Transformer-XL、XLNet和XLM,

另一类主要用于语言理解任务,如Bert、DistilBert、RoBERTa、XLM.

三、环境依赖

pip install transformers==4.20.0

transformers · PyPI

四、实践

1、 vocab.txt 是已经设定好的词表

2、分词编码

利用transformers库中的BertTokenizer实现分词编码

from transformers import BertTokenizer#111
bert_name = './bert-base-chinese'
tokenizer = BertTokenizer.from_pretrained(bert_name)
text = '窗前明月光,'
input_ids = tokenizer.encode(text,#需要编码的文本;
add_special_tokens=True,#是否添加特殊token,即CLS分类token和SEP分隔token;
max_length=128,#文本的最大长度
truncation=True,#使用truncation=True来明确地将示例截断为最大长度。
padding='max_length',#将批次中所有序列填充到最长序列的长度
return_tensors='pt'# 返回的tensor类型,有4种为 [‘pt’, ‘tf’, ‘np’, ‘jax’] 分别代表 pytorch tensor、tensorflow tensor、int32数组形式和 jax tensor;
)
print('text:\n', text)
print('text字符数:', len(text))
print('input_ids:\n', input_ids)
print('input_ids大小:', input_ids.size())

3、特殊标记

整个词表的大小为21128个字,共有5种特殊token标记:

[PAD]: 填充标记,编码为0;
[UNK]: 未知字符标记,即该字不在所定义的词表中,编码为100;
[CLS]: 分类标记,蕴含整个文本的含义,编码为101;
[SEP]: 分隔字符标记,用于断开两句话,编码为102;
[MASK]: 掩码标记,该字被遮挡,编码为103;


4、补充:

某些transformers版本 或者会产生一些提醒,但是可以正常运行,我们可以加上以下语句来清除警告

from transformers import logging

logging.set_verbosity_error()

http://www.cadmedia.cn/news/4817.html

相关文章:

  • 网站建设与管理案例教程教学大纲北京网站托管
  • 网站收录服务百度图片搜索网页版
  • 那些公司做网站百度账号批发网
  • 苍南配网设计seo入门培训班
  • 临城网站建设服务热线百度seo建议
  • 泰州企业模板建站日照网站优化公司
  • 江西建设三类人员网站百度关键词优化大师
  • 怎么做网站不用备案seo积分优化
  • 企业网站建设多少家宣传推广计划
  • 厦门关键词seo排名网站在线友情链接
  • 福州网站建设公司哪家好seo基础知识
  • 郑州做网站九零后今日头条最新消息
  • 网站怎么放到服务器百度最新人工智能
  • 免费建立属于自己的网站在线生成网站
  • 东莞网站建设aj网站优化推广招聘
  • 东莞高端做网站推广普通话手抄报一等奖
  • 杭州设计企业网站高端公司近一周的新闻大事热点
  • 学网站平面设计廊坊seo
  • 网站建设课程毕设seo哪个软件好
  • 惠州网站建设公司推荐乐云seo杭州seo运营
  • 全国软件开发公司排名前一百seo论坛站长交流
  • 企业网站怎么优化百度地址
  • b2c平台网站北京百度快速优化排名
  • 前端好学还是后端好学宝鸡seo
  • 网站建设 提供源码芭蕉视频app无限次数
  • 学做日料的网站网站ip查询
  • 广州网站建设公网站关键词查询网址
  • 百度搜索网百度快速收录seo工具软件
  • 深圳网站建设定制开发超凡科技seo网站优化服务合同
  • 网站排名优化外包沈阳沈河seo网站排名优化