我今天所做的是最重要的,因为我将永远不会再有今天

2011年04月的内容

漫话中文分词算法
技术文档

漫话中文分词算法

2011-04-30 2011-04-30 3814浏览 4评论 简洁版

记得第一次了解中文分词算法是在 Google 黑板报 上看到的,当初看到那个算法时我彻底被震撼住了,想不到一个看似不可能完成的任务竟然有如此神奇巧妙的算法。最近在詹卫东老师的《中文信息处理导论》课上再次学到中文分词算法,才知道这并不是中文分词算法研究的全部,前前后后还有很多故事可讲。在没有建立统计语言模型时,人们还在语言学的角度对自动分词进行研究,期间诞生了很多有意思的理论。

中文分词的主要困难在于分词歧义。“结婚的和尚未结婚的”,应该分成“结婚/的/和/尚未/结婚/的”,还是“结婚/的/和尚/未/结婚/的”?人来判断很容易,要交给计算机来处理就麻烦了。问题的关键就是,“和尚未”里的“和尚”也是一个词,“尚未”也是一个词,从计算机的角度看上去,两者似乎都有可能。对于计算机来说,这样的分词困境就叫做“交集型歧义”。

有时候,交集型歧义的“歧义链”有可能会更长。“中外科学名著”里,“中外”、“外科”、“科学”、“学名”、“名著”全是词,光从词库的角度来看,随便切几刀下去,得出的切分都是合理的。类似的例子数不胜数,“提高产品质量”、“鞭炮声响彻夜空”、“努力学习语法规则”等句子都有这样的现象。在这些极端例子下,分词算法谁优谁劣可谓是一试便知。

阅读更多...

WordPress获取豆瓣信息(缓存版)
技术文档

WordPress获取豆瓣信息(缓存版)

2011-04-28 最后修改:2011-07-8 10:55 19514浏览 19评论 简洁版

豆瓣呢,是个很不错的网站,无论从内容还是技术上。我的豆瓣号码貌似还是申请得比较早的,只是很长时间没有去折腾了。欢迎您去访问:http://www.douban.com/people/loosky/

这次的主要目的就是在WordPress中通过页面展示豆瓣上的一些信息,如电影、书籍、音乐等,同样,还是有很多热心的网友开发了一些插件,可以实现类似的功能。只是最近比较喜欢自己去折腾实现,所以还是通过自己动手实现了。

效果:http://loosky.net/?page_id=1651
特色:函数直接调用,内容缓存+图片缓存,加快访问速度

阅读更多...

WordPress Transients API 介绍
技术文档

WordPress Transients API 介绍

2011-04-27 2011-04-27 6356浏览 3评论 简洁版

Transients 是瞬时的意思,WordPress 的 Transients API 就是 WordPress 用来存储一些缓存的数据到数据库中最简单也是最标准的方法,Transients API 给这些缓存的数据一个过期时间,并且时间已到就会自动删除,所以如果你在制作 WordPress 插件的时候,需要存储一些有生命周期的选项的时候,Transients API 就是最好的选择。

WordPress Transients API 函数

Transients API 是 WordPress 2.8 版本开始才有的,它和 WordPress 的 Option API (get_optionadd_optionupdate_optiondelete_option))基本一样,也是使用 WordPress wp_options 数据表来存储这些缓存数据,唯一区别就是 Transients API 有一个过期时间。

Transients API 以下三个函数:set_transient()get_transient(), delete_transient()

阅读更多...

动态图片之美
相册

动态图片之美

2011-04-27 2011-04-27 9661浏览 2评论 简洁版

在这个信息爆炸的时代,我们很容易就欣赏到许多的“艺术品”,但是以下这些Gif图片却完美的让人无话可说,在此向两位创造者Jamie Beck和Kevin Burg表达敬佩之情。点击每张图片,都可以看到逼真的动态效果。

原链接地址:http://fromme-toyou.tumblr.com/tagged/cinemagraph

理解云计算
技术文档

理解云计算

2011-04-27 最后修改:2011-05-10 11:50 4024浏览 0评论 简洁版

现在互联网最热门的关键字“云计算”,大大小小的公司纷纷加入到这块领域。简单来说,目前的“云计算”主要分为:SaaS、PaaS和IaaS三大类。

其中SaaS云计算,为软件即服务的概念。把传统客户端软件部署在互联网上,用户只需要一个浏览器就可以使用到软件的模式。其实早在2000年就已经有B/S结构的软件服务,与现在所说的SaaS云计算相近,但此前的B/S结构软件服务,数据库等服务端是需要用户自行部署的,而非由软件提供商进行统一部署。SaaS模式则由软件提供商统一部署并提供计算和存储服务。鉴于此特性一方面用户的使用成本降低很多,在软硬件的投入都大大缩小,但由此而衍生新的问题:数据保密和安全性。因为数据都是存放在软件服务商的服务器上,如何保障用户的数据保密性和安全性,将是SaaS模式在推广上的主要门槛。

阅读更多...

国内互联网证件及相关管理机构
经典珍藏

国内互联网证件及相关管理机构

2011-04-26 2011-04-26 7428浏览 0评论 简洁版

名称
适用范围
发证机构

ICP备案
主要是非经营性网站,任何在国内的网站都需要进行ICP备案。
工业和信息化部

BBS电子公告专项备案
BBS,SNS社区等
工业和信息化部

经营性网站备案
通过互联网向用户有偿提供信息等服务活动的经营性网站。
工商行政管理机关

广告经营许可证(网络广告经营)
经营性互联网信息服务提供者为他人设计、制作、发

阅读更多...

VNC配置及使用说明
技术文档

VNC配置及使用说明

2011-04-26 最后修改:2012-11-13 10:10 5379浏览 0评论 简洁版

一般来说,使用Linux做服务器还是很稳定的,相比较于windows 2003,我还是更喜欢Linux。Windows下一般可以使用远程桌面进行连接,Linux下面如果使用命令行进行操作的话,可以使用SSH Secure Shell Client,远程桌面的话则可以使用VNC。
CentOS下默认是可以选择安装vnc-server的,那么你只要启动这个服务就可以了。如果没有安装的话,可以使用如下命令进行安装:

yum install vnc-server

配置VNC服务参数文件

vi /etc/sysconfig/vncservers

在vncservers文件下增加以下3行

VNCSERVERS="1:root 2:test "
VNCSERVERARGS[1]="-name root -geometry 1280x720"
VNCSERVERARGS[2]="-name test -geometry 800x600"

阅读更多...

Linux下svn的使用
技术文档

Linux下svn的使用

2011-04-26 2011-04-26 27682浏览 0评论 简洁版

1、基本命令

(1)查找帮助  svn help

查看的帮助svn help import,在这里有详细的import命令的用法。

(2)svn import

将一个工程加入到svn中,eg

svn import  testproject   [url | file path]

注:testproject为工程目录路径

阅读更多...