Nov 24
lixiangWordpress api, plugin, translation, wordpress, youdao
我自己写的第一个 wordpress 插件,很简单,但很有成就感!
Introduction:
Youdao Translator automatically translates your blog only by move the mouse to choose some words. It supports the following different language pairs:
- Chinese (Simplified) <-> English
- Chinese (Simplified) <-> Japanese
阅读全文
Jan 16
lixiangC++ compare function, map, set, STL
对于 STL 中的 map,我们经常使用时,key_type 经常是基本类型,因此编译器自带比较函数可以比较元素大小,从而建立红黑树,但是如果使用自定义的 key 类型,比如类指针,结构体等,由于没有现成的比较函数,因此一般无法建立合适的 map,这时我们需要根据自己程序的需求设定 key 的比较函数。
STL 中 map 的定义如下:
template < class Key, class T, class Compare = less<Key>,class Allocator = allocator<pair<const Key,
阅读全文
Jan 12
lixiangLinux debug, linux, memory leak, valgrind
Valgrind 是一个GPL的软件,用于 Linux(For x86, amd64 and ppc32)程序的内存调试和代码剖析。你可以在它的环境中运行你的程序来监视内存的使用情况,比如 C 语言中的 malloc 和 free 或者 C++ 中的 new 和 delete。使用Valgrind 的工具包,你可以自动的检测许多内存管理和线程的 bug,避免花费太多的时间在bug寻找上,使得你的程序更加稳固。Valgrind 是在 Linux 系统下开发应用程序时用于调试内存问题的工具。它尤其擅长发现内存管理的问题,它可以检查程序运行时的内存泄漏问题。 要安装 Valgr
阅读全文
Jan 11
lixiangC++ delete, heap, new
今天调试程序,本来一直运行的好好的,由于换了一批数据,在运行过程中突然崩溃,并弹出如下崩溃信息

出错的函数代码如下:
01 inline T* _resize(T *ptr, size_t size, size_t new_size, T val)
02 {
03 T *tmp = new T[new_size];
04 for (register size_t i = 0; i < size; ++i)
05 {
06 &nb
阅读全文
Jan 10
lixiangMachine Learning Logistic Regression
转载自:http://goo.gl/6thpQ
Logistic regression (逻辑回归)是当前业界比较常用的机器学习方法,用于估计某种事物的可能性。比如某用户购买某商品的可能性,某病人患有某种疾病的可能性,以及某广告被用户点击的可能性等。(注意这里是:“可能性”,而非数学上的“概率”,logisitc回归的结果并非数学定义中的概率值,不可以直接当做概率值来用。该结果往往用于和其他特征值加权求和,而非直接相乘)
那么它究竟是什么样的一个东西,又有哪些适用情况和不适用情况呢?
一、官方定义:

阅读全文
Jan 09
lixiangAlgorithm 冒泡排序, 堆排序, 希尔排序, 归并排序, 快速排序, 插入排序, 选择排序
原文转载自:http://goo.gl/L6bC5,感觉很好,轻微修改格式,请作者见谅
1 快速排序
介绍:
快速排序是由东尼·霍尔所发展的一种排序算法。在平均状况下,排序 n 个项目要Ο(n log n)次比较。在最坏状况下则需要Ο(n2)次比较,但这种状况并不常见。事实上,快速排序通常明显比其他Ο(n log n) 算法更快,因为它的内部循环(inner loop)可以在大部分的架构上很有效率地被实现出来,且在大部分真实世界的数据,可以决定设计的选择,减少所需时间的二次方项之可能性。
步骤:
阅读全文
Jan 09
lixiangLife 2012年会, baidu, hr, 度娘, 百度
昨天百度年会,惊现美女HR,度娘这回着实好好宣传了下自己,一个HR在微博上的效应省了百万宣传费,教科书一样的案例啊,成为百度无数技术宅男的心中女神,粉丝暴涨,技术型公司招几个这样的美女具有重要的战术级意义,很多程序员要求组团面试,看来以后进百度难了啊!
Jan 06
lixiangLife 2011, 回顾
一直觉得回顾昨天总是夹杂着伤感和幸福,2011年就这样过去了,来不及道别,来不及再见。
2011年,是我读研究生的第二年,虽然很早就进了实验室参与一些事情,但是这一年的离开却让我不舍,以后再也不会让本本分分学生一样好好读书就是王道,随之而来的是项目,研究工作,论文等。
2011年,做了一些算不上研究的工作,主要是找找感觉,灌灌水,其实有时觉得自己不是非常适合做科研,但真做起来还是很投入很有激情的,2011年还是没有找到自己喜欢做的方向,很可悲,但不放弃
2011年,又去一些地方旅游,广东,内蒙古,其实,我觉得在旅游中是非常单纯的,可以体验不同的生活,风俗,放弃平时的烦恼,就是玩
阅读全文
Jan 05
lixiangAlgorithm bit-map, bloom filter, data processing, hash, inverted index, trie, 海量数据处理
转载自:http://goo.gl/0MPqC
大数据量的问题是很多面试笔试中经常出现的问题,下面的方法是我对海量数据的处理方法进行了一个一般性的总结,当然这些方法可能并不能完全覆盖所有的问题,但是这样的一些方法也基本可以处理绝大多数遇到的问题。下面的一些问题基本直接来源于公司的面试笔试题目,方法不一定最优,如果你有更好的处理方法,欢迎与我讨论。
1.Bloom filter
适用范围:可以用来实现数据字典,进行数据的判重,或者集合求交集
基本原理及要点:
对于原理来说很简单,位数组+k 个独立 hash 函数。将 hash 函数对应的值的位数组
阅读全文
Jan 03
lixiangMachine Learning Chebyshev Distance, Cosine, Euclidean Distance, Hamming Distance, Information Entropy, Jaccard Distance, Mahalanobis Distance, Manhattan Distance, Minkowski Distance
在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。
本文的目的就是对常用的相似性度量作一个总结。
本文目录:
1. 欧氏距离
2. 曼哈顿距离
3. 切比雪夫距离
4. 闵可夫斯基距离
5. 标准化欧氏距离
6. 马氏距离
7. 夹角余弦
8. 汉明距离
9. 杰卡德距离 & 杰卡德相似系数
阅读全文
Dec 28
lixiangC++ g++, linux, map, STL, windows
最近在做一个项目,需要用到一个词典的小功能,由于暂时不需要考虑效率,我就使用了STL 的 map 容器,但在测试过程中发现 Windows 和 Linux 下存在不同的映射结果,其中 Windows 的结果跟自己设计的一样,而 Linux 却出现差错,debug 好久才发现如下问题:
其中,Linux 平台下使用的编译器版本为 g++ 4.1.2,Windows 下使用 Visual Studio 2010 编译。
1 std::map<string, int> dict;
2 dict["china"] = dict.size();
阅读全文
Older Entries