内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • 中文分词原理及工具

    原理中文分词,即 Chinese Word Segmentation,即将一个汉字序列进行切分,得到一个个单独的词。表面上看,分词其实就是那么回事,但分词效果好不好对信息检索、实验结果还是有很大影响的,同时分词的背后其实是涉及各种各样的算法的。中文分词与英文分词有很大的不同,对英

    作者: 崔庆才丨静觅
    发表时间: 2018-11-20 15:48:36
    4471
    0
  • NSURL汉字UTF8编码

    [str stringByAddingPercentEscapesUsingEncoding:NSUTF8StringEncoding];

    作者: 清雨小竹
    发表时间: 2022-09-24 16:25:03
    110
    0
  • 支持中文域名的重要性和建议

    支持中文域名既能在根域名这个节点上维护我国的网络自主权,也能方便用户在中文环境下访问网站,再者,中文域名方便用户语音输入域名访问网站,日文域名和韩文域名分别在日本和韩国都很流行,据此,我们更应将中文域名这一具有中国特色文化的互联网基础应用加以推广。 中文域名最大的优势在于语音输入

    作者: 数据智能
    12906
    9
  • GB2312、GBK汉字取模与字库偏移地址的计算-单片机上常用

    一条线。 GBK 共收入 21886 个汉字和图形符号,包括: GB2312 中的全部汉字、非汉字符号。 BIG5 中的全部汉字。 与 ISO 10646 相应的国家标准 GB13000 中的其它 CJK 汉字,以上合计 20902 个汉字。 其它汉字、部首、符号,共计 984 个。 GBK

    作者: DS小龙哥
    2648
    21
  • 快速提取文件中的汉字(或者有用的信息)

    有时候,我们需要从一长串字符串中提取中文,比如如下这样的:我们可以看到,中文的长度参差不齐,在字符串中的位置也不固定。因此无论是用Excel自带的left,right,mid 函数,还是使用分列都无能为力。下面介绍通过Python的正则表达式,一键轻松提取中文。 应用 先来说说IPython

    作者: 肥学
    发表时间: 2022-03-26 17:13:58
    206
    0
  • Python读入中文记得要encoding=“utf-8“

    用python将中文汉字写入文本文档或者从文本文档读取中文信息 经常有同学碰到通过python无法将汉字信息写入文本,或者无法读取文本里的汉字信息的情况,读取结果为乱码,下面用一种简单的方式解决这个问题。 写入文本文档:

    作者: irrational
    发表时间: 2022-01-23 16:03:54
    681
    0
  • 张小白教你如何在CentOS7上安装ElasticSearch 7.16.3

    ../bin/elasticsearch restart 四、安装pinyin插件 ES的pinyin插件,可以让ES具备通过汉字拼音或者汉字拼音混合搜索的能力。 打开 https://github.com/medcl/elasticsearch-analysis-pinyin

    作者: 张辉
    发表时间: 2022-01-31 00:08:14
    1730
    0
  • 5个祖传的Python自动化办公项目,治愈你的抑郁

    quality=50) # 质量,1-100之间,数值越低压缩率越高 4、汉字拼音 1行代码,实现汉字拼音。 # pip install pohan import pohan from pohan.pinyin.pinyin import

    作者: 程序员晚枫
    发表时间: 2023-07-06 23:50:40
    6
    0
  • 汉字unicode转换工具,供大家转换时测试使用。

    在这里共享一个小工具,用来转换汉字与unicode,供大家测试使用。使用的场景:1、短信工具收到的编码转换成汉字。2、汉字转换成unicode后发送短信。unicode 样例:0079006F0075007200200063006F006400650020006900730020

    作者: We are WeAutomate
    1071
    1
  • DWS VARCHAR存放字符即VARCHAR(1)存放1个汉字

    utf8编码的数据库,使用nvarchar2(n)代替varchar(n)。nvarchar2这个类型的n是字符长度,汉字跟字母都算1个

    作者: 瘸子那条好腿
    653
    1
  • STM32 OLED显示字符汉字

    在电子产品中,OLED 屏幕通常用于显示各种文本、图标、图像等内容。本篇文章将介绍 `使用 I2C 接口 在 OLED 屏幕上显示字符,汉字。` --- # 一、 OLED 接线: 我使用的 OLED 分辨率是 128x64。这里我使用 **STM32** 上的 2 个接口模拟

    作者: 糖果罐子
    发表时间: 2023-10-31 20:35:41
    6
    0
  • 使用小藤实现手写汉字识别

    可见 ch_ppocr_server_v2.0_rec_infer_bs1.om 离线模型已生成。 下载手写汉字数据集 mkdir dataset 浏览器 下载 https://mindx.sdk.obs.cn-north-4.myhuaweicloud

    作者: 张辉
    发表时间: 2023-09-01 07:35:11
    35
    0
  • 没有中文

    如题,无论是用文档里给的ctrl shift p然后搜索display再设置语言还是直接在左下角设置语言都没有中文这个不是Online版本,是下载下来的客户端,标签选择online是因为没有Codearts IDE这个标签

    作者: yd_272509909
    27
    1
  • [Python人工智能] 二十六.基于BiLSTM-CRF的医学命名实体识别研究(上)数据预处理

    'n', 'n', 'n', 'n', 'x', 't', 't', 'x'] ) 3.获取拼音特征 首先,我们安装一个工具包cnradical,它用于提取中文的偏旁部首和拼音。 pip install cnradical https://github.com/wa

    作者: eastmount
    发表时间: 2022-01-07 07:05:20
    2582
    0
  • OpenCart电商搭建指导(含中文包安装)

    根据操作指导一步步安装。(本文根据笔者实际操作,提供一种安装中文包的指导,详细如下)好了,开始安装中文包!首先请下载笔者已经找的中文包,见本篇文章的附件(oc3x.ocmod.zip),解压缩,可以看到两个目录(admin、catalog)。这两个目录里面分别是网站前台、后台的中文包,需要上传至网站的服务器对应

    作者: 风风火火就是我
    发表时间: 2018-04-12 15:29:44
    13445
    1
  • 【微服务】Elasticsearch数据聚合&自动补全&数据同步(四)

    如上可以看到我们已经成功安装好了拼音分词器。但是它还存在一些问题,无法直接使用,接下来让我们一起解决吧。 (2) 自定义分词器 (2.1) 概述 默认的拼音分词器会将每个汉字单独分为拼音,而我们所希望的是每个词条形成一组拼音,因此需要对拼音分词器做个性化定制,形成自定义分词器。

    作者: 观止study
    发表时间: 2023-05-30 21:48:41
    5
    0
  • 【java蓝桥杯_历届真题】密码发生器

    不好记的密码,又担心自己也会忘记;如果写在纸上,担心纸张被别人发现或弄丢了...   这个程序的任务就是把一串拼音字母转换为6位数字(密码)。我们可以使用任何好记的拼音串(比如名字,王喜明,就写:wangximing)作为输入,程序输出6位数字。   变换的过程如下:   第一步

    作者: 昵称:
    发表时间: 2022-03-09 09:43:43
    313
    0
  • HMM实现中文分词

    import numpy as np import warnings from hmmlearn.hmm import MultinomialHMM as mhmm data=[{ u"我要吃饭":"SSBE"}, { u"天气不错" : "BEBE"}, { u"谢天谢地"

    作者: 毛利
    发表时间: 2021-07-15 01:20:58
    1673
    0
  • APP算法展示中文乱码解决方法

    算法输出结果在SIMS上显示中文乱码,其原因为:GB2312对汉字采用双字节编码,即中文占用2个字符,用户需要将中文转换成16进制字符编码。比如:“置信度”三个字的GB2312字符编码为: 1. 用户需要自定义一个unsigned char数组,保持转义后的中文字符,并将数组内容作为S

    作者: HelloHolos
    4110
    0
  • 部署Atlas200DK运行手写汉字识别样例

    les/blob/master/cplusplus/environment二、    打开样例及模型准备用MindStudio直接打开手写汉字识别样例将下载好的模型及权重文件保存到项目中的model文件夹选择模型转换选择模型MindStudio会自动选择同一目录下的权重文件点击N

    作者: 海中之龙
    5711
    1