• memcached详解
    时间:2009-01-11   作者:佚名   出处:互联网

    Memcached由Danga Interactive开发,用于提升LiveJournal.com访问速度的。LJ每秒动态页面访问量几千次,用户700万。Memcached将数据库负载大幅度降低,更好的分配资源,更快速访问。

    Memcached是什么?

    Memcached是高性能的,分布式的内存对象缓存系统,用于在动态应用中减少数据库负载,提升访问速度。
    Memcached由Danga Interactive开发,用于提升LiveJournal.com访问速度的。LJ每秒动态页面访问量几千次,用户700万。Memcached将数据库负载大幅度降低,更好的分配资源,更快速访问。

    如何使用memcached-Server端?
    在服务端运行:

    # ./memcached -d -m 2048 -l 10.0.0.40 -p 11211

    这将会启动一个占用2G内存的进程,并打开11211端口用于接收请求。由于32位系统只能处理4G内存的寻址,所以在大于4G内存使用PAE的32位服务器上可以运行2-3个进程,并在不同端口进行监听。

    如何使用memcached-Client端?
    在应用端包含一个用于描述Client的Class后,就可以直接使用,非常简单。
    PHP Example:

    $options["servers"] = array("192.168.1.41:11211", "192.168.1.42:11212");
    $options["debug"] = false;
    $memc = new MemCachedClient($options);
    $myarr = array("one","two", 3);
    $memc->set("key_one", $myarr);
    $val = $memc->get("key_one");
    print $val[0]."\n"; // prints 'one‘
    print $val[1]."\n"; // prints 'two‘
    print $val[2]."\n"; // prints 3

    为什么不使用数据库做这些?

    暂且不考虑使用什么样的数据库(MS-SQL, Oracle, Postgres, MysQL-InnoDB, etc..), 实现事务(ACID,Atomicity, Consistency, Isolation, and Durability )需要大量开销,特别当使用到硬盘的时候,这就意味着查询可能会阻塞。当使用不包含事务的数据库(例如Mysql-MyISAM),上面的开销不存在,但 读线程又可能会被写线程阻塞。
    Memcached从不阻塞,速度非常快。

    为什么不使用共享内存?
    最初的缓存做法是在线程内对对象进行缓存,但这样进程间就无法共享缓存,命中率非常低,导致缓存效率极低。后来出现了共享内存的缓存,多个进程或者线程共享同一块缓存,但毕竟还是只能局限在一台机器上,多台机器做相同的缓存同样是一种资源的浪费,而且命中率也比较低。
    Memcached Server和Clients共同工作,实现跨服务器分布式的全局的缓存。并且可以与Web Server共同工作,Web Server对CPU要求高,对内存要求低,Memcached Server对CPU要求低,对内存要求高,所以可以搭配使用。

    Mysql 4.x的缓存怎么样?
    Mysql查询缓存不是很理想,因为以下几点:
    当指定的表发生更新后,查询缓存会被清空。在一个大负载的系统上这样的事情发生的非常频繁,导致查询缓存效率非常低,有的情况下甚至还不如不开,因为它对cache的管理还是会有开销。
    在32位机器上,Mysql对内存的操作还是被限制在4G以内,但memcached可以分布开,内存规模理论上不受限制。
    Mysql上的是查询缓存,而不是对象缓存,如果在查询后还需要大量其它操作,查询缓存就帮不上忙了。
    如果要缓存的数据不大,并且查询的不是非常频繁,这样的情况下可以用Mysql 查询缓存,不然的话memcached更好。

    数据库同步怎么样?
    这里的数据库同步是指的类似Mysql Master-Slave模式的靠日志同步实现数据库同步的机制。
    你可以分布读操作,但无法分布写操作,但写操作的同步需要消耗大量的资源,而且这个开销是随着slave服务器的增长而不断增长的。
    下一步是要对数据库进行水平切分,从而让不同的数据分布到不同的数据库服务器组上,从而实现分布的读写,这需要在应用中实现根据不同的数据连接不同的数据库。
    当这一模式工作后(我们也推荐这样做),更多的数据库导致更多的让人头疼的硬件错误。
    Memcached可以有效的降低对数据库的访问,让数据库用主要的精力来做不频繁的写操作,而这是数据库自己控制的,很少会自己阻塞 自己。

    Memcached快吗?

    非常快,它使用libevent,可以应付任意数量打开的连接(使用epoll,而非poll),使用非阻塞网络IO,分布式散列对象到不同的服务器,查询复杂度是O(1)。

    参考资料:
    Distributed Caching with Memcached | Linux Journal
    http://www.danga.com/

    肖理达 (KrazyNio AT hotmail.com), 2006.04. 06, 转载请注明出处

    一、memcached 简介

    在很多场合,我们都会听到 memcached 这个名字,但很多同学只是听过,并没有用过或实际了解过,只知道它是一个很不错的东东。这里简单介绍一下,memcached 是高效、快速的分布式内存对象缓存系统,主要用于加速 WEB 动态应用程序。

    二、memcached 安装

    首先是下载 memcached 了,目前最新版本是 1.1.12,直接从官方网站即可下载到 memcached-1.1.12.tar.gz。除此之外,memcached 用到了 libevent,我下载的是 libevent-1.1a.tar.gz。

    接下来是分别将 libevent-1.1a.tar.gz 和 memcached-1.1.12.tar.gz 解开包、编译、安装:

    # tar -xzf libevent-1.1a.tar.gz
    # cd libevent-1.1a
    # ./configure --prefix=/usr
    # make
    # make install
    # cd ..
    # tar -xzf memcached-1.1.12.tar.gz
    # cd memcached-1.1.12
    # ./configure --prefix=/usr
    # make
    # make install

    安装完成之后,memcached 应该在 /usr/bin/memcached。

    三、运行 memcached 守护程序

    运行 memcached 守护程序很简单,只需一个命令行即可,不需要修改任何配置文件(也没有配置文件给你修改 ):

    /usr/bin/memcached -d -m 128 -l 192.168.1.1 -p 11211 -u httpd

    参数解释:

    -d 以守护程序(daemon)方式运行 memcached;
    -m 设置 memcached 可以使用的内存大小,单位为 M;
    -l 设置监听的 IP 地址,如果是本机的话,通常可以不设置此参数;
    -p 设置监听的端口,默认为 11211,所以也可以不设置此参数;
    -u 指定用户,如果当前为 root 的话,需要使用此参数指定用户。

    当然,还有其它参数可以用,man memcached 一下就可以看到了。

    四、memcached 的工作原理

    首先 memcached 是以守护程序方式运行于一个或多个服务器中,随时接受客户端的连接操作,客户端可以由各种语言编写,目前已知的客户端 API 包括 Perl/PHP/Python/Ruby/Java/C#/C 等等。PHP 等客户端在与 memcached 服务建立连接之后,接下来的事情就是存取对象了,每个被存取的对象都有一个唯一的标识符 key,存取操作均通过这个 key 进行,保存到 memcached 中的对象实际上是放置内存中的,并不是保存在 cache 文件中的,这也是为什么 memcached 能够如此高效快速的原因。注意,这些对象并不是持久的,服务停止之后,里边的数据就会丢失。

    三、PHP 如何作为 memcached 客户端

    有两种方法可以使 PHP 作为 memcached 客户端,调用 memcached 的服务进行对象存取操作。

    第一种,PHP 有一个叫做 memcache 的扩展,Linux 下编译时需要带上 –enable-memcache[=DIR] 选项,Window 下则在 php.ini 中去掉 php_memcache.dll 前边的注释符,使其可用。

    除此之外,还有一种方法,可以避开扩展、重新编译所带来的麻烦,那就是直接使用 php-memcached-client。

    本文选用第二种方式,虽然效率会比扩展库稍差一些,但问题不大。

    四、PHP memcached 应用示例

    首先 下载 memcached-client.php,在下载了 memcached-client.php 之后,就可以通过这个文件中的类“memcached”对 memcached 服务进行操作了。其实代码调用非常简单,主要会用到的方法有 add()、get()、replace() delete(),方法说明如下:

    add ($key, $val, $exp = 0)

    往 memcached 中写入对象,$key 是对象的唯一标识符,$val 是写入的对象数据,$exp 为过期时间,单位为秒,默认为不限时间;

    get ($key)

    从 memcached 中获取对象数据,通过对象的唯一标识符 $key 获取;

    replace ($key, $value, $exp=0)

    使用 $value 替换 memcached 中标识符为 $key 的对象内容,参数与 add() 方法一样,只有 $key 对象存在的情况下才会起作用;

    delete ($key, $time = 0)

    删除 memcached 中标识符为 $key 的对象,$time 为可选参数,表示删除之前需要等待多长时间。

    下面是一段简单的测试代码,代码中对标识符为 ‘mykey’ 的对象数据进行存取操作:

    PHP代码:

    // 包含 memcached 类文件
    require_once("memcached-client.php");
    // 选项设置
    $options = array(
      
    "servers" => array("192.168.1.1:11211′), //memcached 服务的地址、端口,可用多个数组元素表示多个 memcached 服务
      
    "debug" => true, //是否打开 debug
      
    "compress_threshold" => 10240, //超过多少字节的数据时进行压缩
      
    "persistant" => false //是否使用持久连接
       );
    // 创建 memcached 对象实例
    $mc = new memcached($options);
    // 设置此脚本使用的唯一标识符
    $key = "mykey";
    // 往 memcached 中写入对象
    $mc->add($key, "some random strings");
    $val = $mc->get($key);
    echo
    "n".str_pad("$mc->add() ", 60, "_")."n";
    var_dump(
    $val);
    // 替换已写入的对象数据值
    $mc->replace($key, array("some"=>"haha", "array"=>"xxx"));
    $val = $mc->get($key);
    echo
    "n".str_pad("$mc->replace() ", 60, "_")."n";
    var_dump(
    $val);
    // 删除 memcached 中的对象
    $mc->delete($key);
    $val = $mc->get($key);
    echo
    "n".str_pad("$mc->delete() ", 60, "_")."n";
    var_dump(
    $val);
    ?>

    是不是很简单,在实际应用中,通常会把数据库查询的结果集保存到 memcached 中,下次访问时直接从 memcached 中获取,而不再做数据库查询操作,这样可以在很大程度上减轻数据库的负担。通常会将 SQL 语句 md5() 之后的值作为唯一标识符 key。下边是一个利用 memcached 来缓存数据库查询结果集的示例(此代码片段紧接上边的示例代码):

    PHP代码:

    $sql = "SELECT * FROM users";
    $key = md5($sql); //memcached 对象标识符
    if ( !($datas = $mc->get($key)) ) {
      
    // 在 memcached 中未获取到缓存数据,则使用数据库查询获取记录集。
      
    echo "n".str_pad("Read datas from MySQL.", 60, "_")."n";
      
    $conn = mysql_connect("localhost", "test", "test");
      
    mysql_select_db("test");
      
    $result = mysql_query($sql);
      
    while ($row = mysql_fetch_object($result))
      
    $datas[] = $row;
      
    // 将数据库中获取到的结果集数据保存到 memcached 中,以供下次访问时使用。
      
    $mc->add($key, $datas);
    } else {
      
    echo "n".str_pad("Read datas from memcached.", 60, "_")."n";
    }
    var_dump($datas);

    可以看出,使用 memcached 之后,可以减少数据库连接、查询操作,数据库负载下来了,脚本的运行速度也提高了。

    之前我曾经写过一篇名为《PHP 实现多服务器共享 SESSION 数据》文章,文中的 SESSION 是使用数据库保存的,在并发访问量大的时候,服务器的负载会很大,经常会超出 MySQL 最大连接数,利用 memcached,我们可以很好地解决这个问题,工作原理如下:

    用户访问网页时,查看 memcached 中是否有当前用户的 SESSION 数据,使用 session_id() 作为唯一标识符;如果数据存在,则直接返回,如果不存在,再进行数据库连接,获取 SESSION 数据,并将此数据保存到 memcached 中,供下次使用;
    当前的 PHP 运行结束(或使用了 session_write_close())时,会调用 My_Sess::write() 方法,将数据写入数据库,这样的话,每次仍然会有数据库操作,对于这个方法,也需要进行优化。使用一个全局变量,记录用户进入页面时的 SESSION 数据,然后在 write() 方法内比较此数据与想要写入的 SESSION 数据是否相同,不同才进行数据库连接、写入数据库,同时将 memcached 中对应的对象删除,如果相同的话,则表示 SESSION 数据未改变,那么就可以不做任何操作,直接返回了;
    那么用户 SESSION 过期时间怎么解决呢?记得 memcached 的 add() 方法有个过期时间参数 $exp 吗?把这个参数值设置成小于 SESSION 最大存活时间即可。另外别忘了给那些一直在线的用户延续 SESSION 时长,这个可以在 write() 方法中解决,通过判断时间,符合条件则更新数据库数据。
    五、相关资源

    memcached 官方网站
    PHP memcached client
    下载 memcached-client.php

    网友留言/评论

    我要留言/评论