有道翻译WordPress插件新鲜出炉

No Comments

我自己写的第一个 wordpress 插件,很简单,但很有成就感!

Introduction:

Youdao Translator automatically translates your blog only by move the mouse to choose some words. It supports the following different language pairs:

  • Chinese (Simplified) <-> English
  • Chinese (Simplified) <-> Japanese

阅读全文

C++ STL 中 map 的自定义比较函数

No Comments

   对于 STL 中的 map,我们经常使用时,key_type 经常是基本类型,因此编译器自带比较函数可以比较元素大小,从而建立红黑树,但是如果使用自定义的 key  类型,比如类指针,结构体等,由于没有现成的比较函数,因此一般无法建立合适的 map,这时我们需要根据自己程序的需求设定 key 的比较函数。

  STL 中 map 的定义如下:

  template < class Key, class T, class Compare = less<Key>,class Allocator = allocator<pair<const Key,

阅读全文

使用 Valgrind 查找内存泄露

No Comments

Valgrind 是一个GPL的软件,用于 Linux(For x86, amd64 and ppc32)程序的内存调试和代码剖析。你可以在它的环境中运行你的程序来监视内存的使用情况,比如 C 语言中的 malloc 和 free 或者 C++ 中的 new 和 delete。使用Valgrind 的工具包,你可以自动的检测许多内存管理和线程的 bug,避免花费太多的时间在bug寻找上,使得你的程序更加稳固。Valgrind 是在 Linux 系统下开发应用程序时用于调试内存问题的工具。它尤其擅长发现内存管理的问题,它可以检查程序运行时的内存泄漏问题。 要安装 Valgr

阅读全文

new和delete操作一定要谨慎再谨慎

4 Comments

  今天调试程序,本来一直运行的好好的,由于换了一批数据,在运行过程中突然崩溃,并弹出如下崩溃信息

heap_error

  出错的函数代码如下:

01 inline T* _resize(T *ptr, size_t size, size_t new_size, T val)
02 {
03     T *tmp = new T[new_size];
04     for (register size_t i = 0; i < size; ++i)
05     {
06  &nb

阅读全文

Logistic Regression(逻辑回归)概述

No Comments

  转载自:http://goo.gl/6thpQ

  

  Logistic regression (逻辑回归)是当前业界比较常用的机器学习方法,用于估计某种事物的可能性。比如某用户购买某商品的可能性,某病人患有某种疾病的可能性,以及某广告被用户点击的可能性等。(注意这里是:“可能性”,而非数学上的“概率”,logisitc回归的结果并非数学定义中的概率值,不可以直接当做概率值来用。该结果往往用于和其他特征值加权求和,而非直接相乘)

  那么它究竟是什么样的一个东西,又有哪些适用情况和不适用情况呢?

一、官方定义:

阅读全文

视觉上直观感受若干常用排序算法

No Comments

  原文转载自:http://goo.gl/L6bC5,感觉很好,轻微修改格式,请作者见谅

1 快速排序

  介绍:

  快速排序是由东尼·霍尔所发展的一种排序算法。在平均状况下,排序 n 个项目要Ο(n log n)次比较。在最坏状况下则需要Ο(n2)次比较,但这种状况并不常见。事实上,快速排序通常明显比其他Ο(n log n) 算法更快,因为它的内部循环(inner loop)可以在大部分的架构上很有效率地被实现出来,且在大部分真实世界的数据,可以决定设计的选择,减少所需时间的二次方项之可能性。

  步骤:

阅读全文

众里寻她签百度

No Comments

  昨天百度年会,惊现美女HR,度娘这回着实好好宣传了下自己,一个HR在微博上的效应省了百万宣传费,教科书一样的案例啊,成为百度无数技术宅男的心中女神,粉丝暴涨,技术型公司招几个这样的美女具有重要的战术级意义,很多程序员要求组团面试,看来以后进百度难了啊!

迟到的2011年回顾

No Comments

  一直觉得回顾昨天总是夹杂着伤感和幸福,2011年就这样过去了,来不及道别,来不及再见。
  2011年,是我读研究生的第二年,虽然很早就进了实验室参与一些事情,但是这一年的离开却让我不舍,以后再也不会让本本分分学生一样好好读书就是王道,随之而来的是项目,研究工作,论文等。
  2011年,做了一些算不上研究的工作,主要是找找感觉,灌灌水,其实有时觉得自己不是非常适合做科研,但真做起来还是很投入很有激情的,2011年还是没有找到自己喜欢做的方向,很可悲,但不放弃
  2011年,又去一些地方旅游,广东,内蒙古,其实,我觉得在旅游中是非常单纯的,可以体验不同的生活,风俗,放弃平时的烦恼,就是玩

阅读全文

海量数据处理方法总结

1 Comment

  转载自:http://goo.gl/0MPqC

  大数据量的问题是很多面试笔试中经常出现的问题,下面的方法是我对海量数据的处理方法进行了一个一般性的总结,当然这些方法可能并不能完全覆盖所有的问题,但是这样的一些方法也基本可以处理绝大多数遇到的问题。下面的一些问题基本直接来源于公司的面试笔试题目,方法不一定最优,如果你有更好的处理方法,欢迎与我讨论。

  1.Bloom filter

  适用范围:可以用来实现数据字典,进行数据的判重,或者集合求交集

  基本原理及要点:

  对于原理来说很简单,位数组+k 个独立 hash 函数。将 hash 函数对应的值的位数组

阅读全文

机器学习中的相似性度量

No Comments

  在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。

  本文的目的就是对常用的相似性度量作一个总结。

  本文目录:

  1. 欧氏距离

  2. 曼哈顿距离

  3. 切比雪夫距离

  4. 闵可夫斯基距离

  5. 标准化欧氏距离

  6. 马氏距离

  7. 夹角余弦

  8. 汉明距离

  9. 杰卡德距离 & 杰卡德相似系数

  

阅读全文

linux和windows中stl map的一点差异

2 Comments

  最近在做一个项目,需要用到一个词典的小功能,由于暂时不需要考虑效率,我就使用了STL 的 map 容器,但在测试过程中发现 Windows 和 Linux 下存在不同的映射结果,其中  Windows 的结果跟自己设计的一样,而 Linux 却出现差错,debug 好久才发现如下问题:

  其中,Linux 平台下使用的编译器版本为 g++ 4.1.2,Windows 下使用 Visual Studio 2010 编译。

1 std::map<string, int> dict;
2 dict["china"] = dict.size();

阅读全文

Older Entries