`

开源软件/代码链接合集

阅读更多
定向抓取/抽取:http://www.scrapy.org
流式处理工具:
收集计算https://github.com/nathanmarz/storm
流数据统计https://sites.google.com/site/countminsketch/

中文处理:
简繁转换cconv: http://code.google.com/p/cconv/
汉字转拼音pinyin4j:http://pinyin4j.sourceforge.net/

字符串匹配:
ahocorasick python实现
ahocorasick: https://hkn.eecs.berkeley.edu/~dyoo/python/ahocorasick/
acora: http://pypi.python.org/pypi/acora/1.5
esmre: http://code.google.com/p/esmre/
double array trie:
libdatrie: http://linux.thai.net/~thep/datrie/datrie.html
darts:  http://chasen.org/~taku/software/darts/
darts-clone:  http://code.google.com/p/darts-clone
java aho-corasick: https://github.com/robert-bor/aho-corasick
机器学习:
分类和rank机器学习工具包sofia-ml:http://code.google.com/p/sofia-ml/
一些机器学习算法SGD实现:http://leon.bottou.org/projects/sgd
liblinear: http://www.csie.ntu.edu.tw/~cjlin/liblinear/
libsvm: http://www.csie.ntu.edu.tw/~cjlin/libsvm/
lingpipe: http://alias-i.com/lingpipe/
mahout: http://mahout.apache.org/
libfm: http://www.libfm.org/
graphChi https://code.google.com/p/graphchi/
CRF++ http://code.google.com/p/crfpp/
CRFSuitehttp://www.chokkan.org/software/crfsuite/
Wapiti http://wapiti.limsi.fr/
mloss: https://mloss.org/software/view/332

自然语言处理:
opennlp: http://opennlp.apache.org/
stanford corenlp: http://nlp.stanford.edu/software/corenlp.shtml#Download
srilm(语言模型):http://www.speech.sri.com/projects/srilm/download.html
mallet: http://mallet.cs.umass.edu/
gensim(topic model for human): http://radimrehurek.com/gensim/
TweetNLP: http://www.ark.cs.cmu.edu/TweetNLP/
java机器学习datumboxhttps://github.com/datumbox/datumbox-framework
语料:
20Newsgroups http://people.csail.mit.edu/jrennie/20Newsgroups/
南京大学机器学习与数据挖掘数据和代码http://lamda.nju.edu.cn/CH.Data.ashx
图片处理:
http://code.google.com/p/thumbnailator/
http://yann.lecun.com/exdb/mnist

latex:
latex blog edit: http://latex.codecogs.com/gif.latex?
latax学习:http://latex.yo2.cn
latax Symbols: http://www.artofproblemsolving.com/Wiki/index.php/LaTeX:Symbols
http://web.ift.uib.no/Teori/KURS/WRK/TeX/symALL.html
latax mathhttp://en.wikibooks.org/wiki/LaTeX/Mathematics
http://www.artofproblemsolving.com/Wiki/index.php/Math

cache:
simple-spring-memcached: http://code.google.com/p/simple-spring-memcached/wiki/Getting_Started
收藏链接:
ML/NLP: http://lxmls.it.pt/2013/
python数据分析http://datacommunitydc.org/blog/2013/07/python-for-data-analysis-the-landscape-of-tutorials/?utm_source=rss&utm_medium=rss&utm_campaign=python-for-data-analysis-the-landscape-of-tutorials
Science Machine learning resource: http://m.sciencemag.org/site/feature/data/compsci/machine_learning.xhtml

公开课和slides:
语言类:http://www.codecademy.com/
数据科学https://github.com/bcaffo/courses
CMU高级机器学习http://www.cs.cmu.edu/~./epxing/Class/10715/lecture.html
凸优化http://so.v.ifeng.com/video?q=%E5%87%B8%E4%BC%98%E5%8C%96&c=5#_v_mininav_search_pc
smola的课程http://alex.smola.org/teaching/
分享到:
评论

相关推荐

    开源阅读软件书源-内涵上千书源

    开源阅读软件书源-内涵上千书源

    开源飞信 开源代码openfetion

    openfetion是基于GTK+2.0的飞信开源IM客户端,使用中国移动飞信v4版本协议。 同类软件还有一个叫LibFetion,但是有半年多无...* 完全开源,没有链接非开源库。 * 使用 v4 协议,实现了直接发送短信、自定义头像等功能

    JAVA上百实例源码以及开源项目源代码

    Java局域网通信——飞鸽传书源代码 28个目标文件 内容索引:JAVA源码,媒体网络,飞鸽传书 Java局域网通信——飞鸽传书源代码,大家都知道VB版、VC版还有Delphi版的飞鸽传书软件,但是Java版的确实不多,因此这个Java...

    开源路由软件Quagga 源代码 编译/安装/运行/调试(Eclipse环境)

    NULL 博文链接:https://siwind.iteye.com/blog/1745643

    好用开源免费串口共享软件Serial2Net

    开源免费,源码可查找Github获取(YeLincoln/Serial2Net),工具右下角有链接。功能类似Comfoolery,可以作为telnet服务器共享串口,可以发送telnet选项给客户端,客户端...开源代码安全,可以自己下载代码编译一个。

    一个开源的压缩工具

    NULL 博文链接:https://japankn.iteye.com/blog/553570

    java开源包10

    BlueLeech是一个开源程序,它从指定的URL开始,搜索所有可用的链接,以及链接之上的链接。它在搜索的同时可以下载遇到的链接所指向的所有的或预定义的范围的内容。 WebSocket协议的Java实现 WebSocket4J WebSocket4...

    从开源代码看Java包的使用率

    NULL 博文链接:https://rensanning.iteye.com/blog/1845637

    IOS直播带货直播商城系统开源项目源代码

    该系统使用了开源项目中的框架和组件,所有代码都是100%开源的。这使得该系统具有通用性,无论是个人还是企业都可以使用该系统快速搭建一个属于自己的直播商城系统。该系统基于ThinkPHP 6.0和iOS原生开发,拥有专业...

    WebHTTrack 开源代码 和部分资料

    相关的链接被重新创建,因此你可以自由地浏览本地的网站(适用于任何浏览器).你可以把若干个网站镜像到一起,以便你可以从一个网站跳转到另一个网站上.你还可以更新现存的镜像站点,或者继续一个被中断的传输.该带有许多...

    多功能tg电报群管机器人教程+开源代码

    – 自定义欢迎消息支持使用变量,可以嵌入新成员的名字,群描述,置顶内容和链接等 – 欢迎消息可以在设置中关闭,30秒自毁功能也可以关闭 进群验证 – 支持开启进群验证功能 – 支持自动踢出在一定时间内没有...

    java开源包8

    BlueLeech是一个开源程序,它从指定的URL开始,搜索所有可用的链接,以及链接之上的链接。它在搜索的同时可以下载遇到的链接所指向的所有的或预定义的范围的内容。 WebSocket协议的Java实现 WebSocket4J WebSocket4...

    JAVA上百实例源码以及开源项目

     Java局域网通信——飞鸽传书源代码,大家都知道VB版、VC版还有Delphi版的飞鸽传书软件,但是Java版的确实不多,因此这个Java文件传输实例不可错过,Java网络编程技能的提升很有帮助。 Java聊天程序,包括服务端和...

    单层感知器神经网络matlab代码-awesome-cpp:最有用的开源C/C++资源

    跨平台的免费开源软件,用于管理软件使用独立编译的方法进行构建的过程。最新版本是。 : 注重速度的小型构件工具,最新版本是v1.7.2。 包管理 : 跨平台的Qt包管理工具,可将包依赖直接编译到二进制文件里,支持Windows...

    代码合集.rar

    2012-06-11 12:53 11,255,929 最简单动态链接实例(c++源代码).zip 2012-06-11 12:40 133,689 李春葆课程源代码.rar 2012-06-11 12:38 13,986,022 砷化镓微波功率场效应晶体管及其集成电路.pdf 34 个文件 367,250,...

    卫星影像三维重建-开源软件-cars库测试数据

    卫星影像三维重建-开源软件-cars库的测试数据,旨在快速上手操作和了解cars库的效果和使用,原始数据的打开建议配合【卫星影像三维重建】实用小工具-图像查看器- pvflip文章,其链接方式:...

    Android代码-MyBookshelf

    本软件为开源软件,没有上架Google Play,没有在任何地方售卖,如果想支持我请通过软件里的捐赠,不要在任何地方购买! 关注公众号请搜索:开源阅读软件,有福利噢 blog http://www.hostfans.cn 开发 本项目Fork于 ...

    java开源包6

    BlueLeech是一个开源程序,它从指定的URL开始,搜索所有可用的链接,以及链接之上的链接。它在搜索的同时可以下载遇到的链接所指向的所有的或预定义的范围的内容。 WebSocket协议的Java实现 WebSocket4J WebSocket4...

    java开源包9

    BlueLeech是一个开源程序,它从指定的URL开始,搜索所有可用的链接,以及链接之上的链接。它在搜索的同时可以下载遇到的链接所指向的所有的或预定义的范围的内容。 WebSocket协议的Java实现 WebSocket4J WebSocket4...

Global site tag (gtag.js) - Google Analytics