`
文章列表
转载请标明出处: http://fuliang.iteye.com/blog/1063352 索引基础知识 索引是帮助MySQL有效检索数据的一种数据结构,它是获得高性能的关键,但是人们常常忘记或者错误的理解了它,所以索引通常是现实中最常出现的性能问题。 当你 ...
转载请标明出处: http://fuliang.iteye.com/blog/1060530 在前面的章节,我们已经看到线性回归模型具有很简单的分析性和计算性。我么现在我们讨论这种类似的模型来解决分类问题。分类的目的是给出一个输入向量X,将它赋值为k个离 ...
对一个设计拙劣或者没有做index的schma进行优化,可以很大程度的改善性能。 如果想获得很好的性能,就需要对你运行的特定的queries来设计schema和索引, 你需要估计不同类query的性能需求,和使用的频度,以及需要检索的字段和检索 的条件。优化是一个权衡,索引可以提高检索速度,但是会降低更新速度,一个反 范式的schema可能会在某些查询下加快速度,但在其他情况下可能降低速度。添加 冗余字段、计数器、summary表可以优化查询,但是维护起来很困难。 选择最优的数据类型: Mysql支持大量的各种个样的数据类型,如何正确的选择类型来存储数据是产生高性能 的关键。 1.足够大的越小 ...
转载自 http://www.dataminingblog.com/top-five-articles-in-data-mining/ Data Mining博客最近有篇文章,列举了他们认为的数据挖掘领域的5篇经典文章。个人深为赞同,所以转载一下。 An Introduction to Variable and Feature Selection Isabelle Guyon and André Elisseeff Data Clustering: A Review A.K. Jain, M.N. Murty and P.J. Flynn From Dat ...
如何分支和tags,这个是经常被争议的话题,参考svn最佳实践,主要有以下三种方式: The Never-Branch system 通常在项目的初期,还没有发布可运行的版本。     用户每天都把代码提交到/trunk     在复杂的任务可能会出现/trunk的代码处于通不过编译的错误状态     非常简单的策略,不需要merge代码,不需要学习分支和tag。 The Branch-When-Needed system 这个需要维护分支和trunk,merge,但相对轻量级的解决方案,如果经常有一些小的变更,极少有很大的变更, 这种方式可以避免大量的分支管理和merge操作。    ...
require 'net/http' require 'uri' require 'json' customers = [{ "id" => 1123, "name" => "B-abc", "citys" => "", "company" => "", "siteUrl" => "www.abc.com", &q ...
发送Json请求,结果返回Json. public static JSONObject post(String url,JSONObject json){ HttpClient client = new DefaultHttpClient(); HttpPost post = new HttpPost(url); JSONObject response = null; try { StringEntity s = new StringEntity(json.toString()); s.setContentEncoding("UTF-8&qu ...
3.4 文档局部性敏感哈希(Locality-Sensitive Hashing for Documents) 虽然我们可以通过minhash来压缩大的文档到小的签名,并且仍然能够保留每对文档的相似性。 但是找到相似的对仍然很难实现,因为虽然文档数可能不是非常多,但是文 ...
第三章 查找相似的Items 数据挖掘的一个基本问题是检测相似的Items.比如网页去重,从网页集合中找到近似重复的网页,这类网页通常是内容相同,但是有一些是关于不同站点和镜像的内容。 这章从集合中找到交集,交集和集合大小的相对比率表示相似度,展开介绍相似度。我们会介绍怎样把文本文档的相似性表示为集合问题,这种技术被称为指纹方式。然后介绍了minhashing,他可以将大的集合压缩,并从压缩后的版本导出原来集合的相似度。其他的一些相似度算法在3.9进行了介绍。 一个非常重要的问题是,我们要搜索相似的Items,我们需要比较两两比较,这需要比较太多 的次数,即使每一对比较都非常的简单,但是仍然需要 ...
   工作这么久了,主要就是服务器端的开发,由于业务性质,对于性能的考虑是每天不得不面对的问题,每次出方案,都是以预估总pv、单机支持最大并发、预计机器资源。。。。。。等等一系列问题开始,所以程序运行中单个 ...
第三章 线性回归模型     这章主要介绍线性回归模型,回归问题的目标是给一个D-维的输入变量,预测出一个或者多个目标连续 变量的值。第一章已经介绍了多项式曲线拟合的问题,这个是特殊的回归问题,被称为线性回归模型。 通过线性组合基本函数,可以获得很有用的一类函数,具有很简单的分析属性,并且由于基本函数 可以不是线性函数,所以相对于输入来说,具有非线性,可以描述相对复杂的问题。     给一个由N个观测值组成的训练集{Xn},包括相应的目标值{tn},一种简单的方式是构建恰当的函数y(x), 给出一个输入x,可以得到预测的目标值t。然后更一般的,可以从概率的观点,我们的目标是建模预测分布p(t| ...
Model和View绑定是虽然不是MVC模式的标配,但是Model和View的绑定,为开发者提供的非常方便的方式:视图的数据自动和模型同步并装配完成,避免了繁琐的手工装配过程。 Spring MVC提供了复杂的绑定机制和验证机制(前面的一个文章介绍了更复杂的动态列表的绑定) 我们先看看绑定机制: 我们以广告订单为例,在请求创建订单表单的action中,我们添加一个新创建的模型advertiseOrder: @RequestMapping("/getCreateForm") public ModelAndView getCreateForm(){ ModelAndVi ...
系统大量使用jquery的ajax,Ajax浏览器不能回退和前进,这个给交互操作带来了很多不方便。jquery有个 jquery history plugin这个可以实现回退和前进。 在页面中包含 <script src="js/jquery.history.js" type="text/javascript"></script> jQuery(document).ready(function($) { $.history.init(function(url) { if(url && ur ...
最近有很多客户报表需要提供客户下载,需要生成一个Excel的格式文件,所以写了 一个通用的Excel报表生成代码供各个地方使用: public <T> void createExcelReport(List<T> reports,Map<String,String> headerMap,OutputStream output) throws IOException { if(reports == null || reports.isEmpty()) return; Workbook wb = new HSSFWorkbook(); ...
VIRT:virtual memory usage     1、进程“需要的”虚拟内存大小,包括进程使用的库、代码、数据等     2、假如进程申请100m的内存,但实际只使用了10m,那么它会增长100m,而不是实际的使用量 RES:resident memory usage 常驻内存     1、进程当前使用的内存大小,但不包括swap out     2、包含其他进程的共享     3、如果申请100m的内存,实际使用10m,它只增长10m,与VIRT相反     4、关于库占用内存的情况,它只统计加载的库文件所占内存大小 SHR:shared memory     1、除了 ...
Global site tag (gtag.js) - Google Analytics