自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 资源 (23)
  • 收藏
  • 关注

原创 HMM中文分词_CodingPark编程公园

【中文分词】@python

2020-07-31 16:32:13 1324

原创 隐马尔可夫模型的样本生成&模型训练&预测_CodingPark编程公园

【HMM样本生成】 @python

2020-07-29 16:48:42 1416

原创 Ngram中文分词_CodingPark编程公园

【二元语法中文分词】@python

2020-07-27 16:37:19 1323

原创 数据分析之数据可视化_CodingPark编程公园

数据可视化

2020-07-23 17:41:57 1489 1

原创 数据可视化与文本分类_CodingPark编程公园

【新闻联播语料】@Python

2020-07-23 14:23:06 1431

原创 pip安装时ReadTimeoutError超时 解决办法 _CodingPark编程公园

ReadTimeoutError

2020-07-17 17:14:31 1296

原创 实时疫情地图可视化_CodingPark编程公园
原力计划

利用@python完成 实时疫情地图可视化 全流程

2020-07-17 17:07:14 434

原创 os模块_CodingPark编程公园
原力计划

OS模块实用讲解

2020-07-15 17:00:20 50

原创 raise挂起_CodingPark编程公园

raise - 异常处理

2020-07-14 22:02:02 85 1

原创 数据分析调研报告_CodingPark编程公园
原力计划

数据分析:待分析的目标比较明确数据挖掘:从海量数据中找到隐藏的规则

2020-07-14 16:43:39 1438

原创 字典树 [字典树相关扩展与应用&字典树AC自动机] _ CodingPark编程公园
原力计划

@python

2020-07-13 12:37:50 6384

原创 CPCY模型_CodingPark编程公园

CPCY模型

2020-07-07 08:28:05 6509

原创 切分算法[完全切分 & 正向 & 逆向 & 双向最长匹配 & 速度测评]_CodingPark编程公园
原力计划

【分词】@Python版本

2020-07-06 14:57:44 14244

原创 Import讲解 & Directory与Python package的区别_CodingPark编程公园
原力计划

Import & Python package

2020-07-05 16:39:33 6583

原创 Java-方法讲解_CodingPark编程公园
原力计划

Java方法相关知识

2020-07-03 14:14:18 7979

原创 自然语言处理课程总结_CodingPark编程公园

自然语言处理课程 主要讲解 词法->句法->语义->语用 四个方面

2020-07-02 16:39:26 175

原创 Python List中元素获取-找到那个她_CodingPark编程公园

一层一层拨开她的衣服

2020-07-02 15:14:48 9001

原创 python的sorted函数对字典按value进行排序_CodingPark编程公园

Python 排序函数 sort() 与 sorted()

2020-07-02 15:07:38 7808

原创 List添加元素_Python_CodingPark编程公园

内容概要:list 添加元素的方法包含 append()、extend() 、insert()

2020-07-02 14:34:19 7999

原创 sequence item 0: expected str instance - 已解决_CodingPark编程公园

TypeError: sequence item 0: expected str instance, com.hankcs.hanlp.dictionary.py.Pinyin found其实com.hankcs.hanlp.dictionary.py.Pinyin found部分是啥不那么重要,最要关注的是 -> expected str instance

2020-07-01 15:58:04 7928

OCRTesseract.zip

本项目是利用OCR进行 文转图-图转文,可以理解成有种网络安全专属手段。 ChineseVerify:OCR图转文所需要的中文包 你需要的操作: 加入环境变量 export TESSDATA_PREFIX=/usr/local/Cellar/tesseract/4.1.0/share/tessdata 用ChineseVerify中的tessdata替换/usr/local/Cellar/tesseract/4.1.0/share/tessdata/ tessdata_back_org:官方自带的tessdata包

2021-01-08

OcrChineseVerify.zip

这个文件是OCR中文识别的基于tesseract的安装包,它是需要搭配pytesseract一起使用的,下载后记得还需要调整路径:export TESSDATA_PREFIX=/usr/local/Cellar/tesseract/4.1.0/share/tessdata,下载后,用tessdata替换/usr/local/Cellar/tesseract/4.1.0/share/tessdata/

2021-01-08

ocrWeb.zip

Web识别版Ocr项目,其中ocr内核为baidu-aip、前端内核为HTML+CSS+JS、后端内核为Python

2020-10-29

Sentiment-Analysis-Chinese-pytorch-master.zip

本项目使用了word2vec的中文预训练向量 模型分别有BiLSTM-attention和普通的LSTM两种 1、在Config中配置相关参数 2、然后运行DataProcess.py,生成相应的word2id,word2vec等文件 3、运行主函数main.py,得到训练好的模型,并保存模型 4、运行eval.py,读取模型,并得到评价 5、模型准确率平均85%左右

2020-12-03

KnowledgeGraph知识图谱+智能问答

本项目包含:医学数据json39_tq.json、接口asr_api.py、导入数据2知识图谱creat4KG.py、人机对话ChatRob.py

2020-11-12

ocr_ag.zip

本文件包括:OCR文字识别要完成的任务、OCRdataset设置、CTPN文字检测网络概述、序列网络的作用、输出结果含义解析、CTPN细节概述、CRNN识别网络架构、CTC模块的作用

2020-10-18

大数据之HDFS.docx

大数据-HDFS支持文档 包含HDFS讲解与实战命令:$>start-all.sh $>stop-all.sh $>start-dfs.sh $>start-yarn.sh $>stop-dfs.sh $>stop-yarn.sh

2020-09-11

BoYa数据分析.zip

Numpy 基础、数据初步探索、数据分组与聚合、数据转换与融合2、数据分组与聚合Numpy 基础、数据初步探索、数据分组与聚合、数据转换与融合2、数据分组与聚合Numpy 基础、数据初步探索、数据分组与聚合、数据转换与融合2、数据分组与聚合

2020-09-11

HDFS软件包.zip

hadoop-lzo-master.zip、lz4-1.7.5.tar.gz、lzo-2.06.tar.gz、nexus-2.9.0.war、hadoop2x-eclipse-plugin.zip、jdk-8u111.zip

2020-09-10

NewsAnalyse.zip

本文件包含:chinese_news.csv、pretreatment.py、eda.py、wordcount.py、w2v.py、classifyMod.py 本文件主要方向为 数据可视化与文本分类

2020-07-22

Spy_CodingPark

本文件包含:pythin代码、爬虫文件、数据分析 angelababy.py、plo.py、Na.py等 angelababy_programs_org.csv等

2020-06-15

CRF_Learning_CodingPark

本文件为利用CRF进行命名实体识别 内容包括:199801.txt、data_clean.py、segment.py、train_data.py、model_evaluation.py、Find_It.py 以及CRF++安装包

2020-06-08

DeepNLPStock_advanced_CodingPark

本文件包含两个文件夹:开发源码与相关资料 具体包括CNNStock_advanced.py、Cross_val.py、TF.py、W2V_CNN_StockAdvanced、W2V_CNN_StockAdvancedTest.py、Combined_News_DJIA.csv

2020-06-04

InfoExtra人名识别

本文件包括:Hanlp.py、Corgi_Demo.py、CorgiHMM.py; 利用cocoNLP的InfoExtra.py 等程序

2020-05-25

bayes_CodingPark

本文件包含:bayes_NewsClassification.py、Database、stopwords_cn.txt、data.csv、LanguageDetect.py

2020-05-19

kafka2hdfs_CodingPark

主要完成 kafka 生产数据、接数据 、通过Java代码上传数据的完整流程 文件包括:hdfstest.java、kafkatest.java、Producer.java、NewConsumer.java、NewConsumer2HDFS.java

2020-05-16

kafka搭建所需包_CodingPark

kafka搭建压缩包里包括 Linux所需 zookeeper-3.5.7-bin.tar 和 kafka_2.13-2.4.1.tar

2020-05-13

英文拼写鉴别器_CodingPark

书写语言:Python 程序用途:英文拼写鉴别器。可检查出含有拼写错误的单词且可给出建议提示。主要用到了PyEnchant ,下载PyEnchant的过程可以说是份艰辛了,我在本程序对应的博客中有详细图文解释。

2020-05-12

大数据相关指导资料_CodingPark.zip

本文将包括:Hadoop 安装;hadoop插件安装;WordCount(+排序);采集电商网站交易及评论数据3.1;开发MR程序清洗电商评论数据3.2;4.1利用HiveSQL离线分析评论数据;4.2利用Sqoop进行数据迁移至Mysql数据库;Jweb+Echart;Spark进行实时数据分析(上)Spark进行实时数据分析(下);

2020-04-25

GenerateFile_CodingPark.zip

本项目主要实现:利用java对本地文件进行1本地数据通过路径读取的操作,2写入本地文件,3读取文件并且将读取到的文件写入本地生成一个新的文件

2020-04-20

bayes(NewsClassification&LanguageDetect)_CodingPark.zip

本在压缩包内含有基于贝叶斯的新闻分类与语种鉴别 贝叶斯方法是一个历史悠久,有着坚实的理论基础的方法,同时处理很多问题时直接而又高效,很多高级自然语言处理模型也可以从它演化而来。因此,学习贝叶斯方法,是研究自然语言处理问题的一个非常好的切入口。

2020-04-19

Fop2PDF_TEAM-AG_4.15_CodingPark.zip

1 本zip包为完整项目 2 实现了 写出一个 xml ,写出一个XSLT(fo)式样单,将该XML文档经过XSLT(fo)转换成XSL-FO,再采用FOP将上述文档转换成PDF格式

2020-04-15

pokemon_CodingPark.zip

pokemon图像数据包包括自定义数据机搭配自定义数据机-pokemonGO_完整项目_CodingPark,pokemon图像数据包含有5类图像:皮卡丘、妙蛙种子、杰尼龟、超梦、小火龙。

2020-04-09

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除