亚洲日本一区二区三区,国产精品成人一区二区,亚洲精品在线三区

��博客搬至CSDN

clcl — Tue, 29 Jan 2019 02:39:00 GMT

��博客搬至CSDN

clcl 2019-01-29 10:39 发表评论

epoll那些事儿

clcl — Sat, 14 Jul 2018 03:17:00 GMT

ET和LT:
LT一般用在单�U�程�?/span>
ET和EPOLLONESHOT配合用在多线�E�共享一个epoll环境下，EPOLLONESHOT标记触发�q�的事�g从epoll中移除，下次必须重新注册�Q�用来防止多�U�程同时取到同一个socket的事件��生冲�H��?/span>

epoll_wait �W�三个参�?取事件数量：
单线�E�模型当然尽可能一�ơ多取一些效率高�Q�多�U�程��Z��防止一个线�E�把所有事件取完其他线�E�饥饿，ACE实现是只�?个�?/span>

错误处理�Q?/span>
EAGIN | EINTR | EWOULDBLOCK 重试�?/span>
EPOLLERR | EPOLLHUP | EPOLLRDHUP 断开�q�接�?/span>

惊群�Q?/span>
默认�pȝ��都会有这问题�Q�据说新�pȝ��有修复不�q�还是处理一下比较好�Q�一般解��x��案是同时只有一个线�E�等待accept�Q�可以单独线�E�accept�Q�将�q�接在分�l�其他工作线�E�。nginx是多�q�程模型�Q��用了��Z��׃�n内存的互斥锁�Q��得同时只有一个工作进�E�的epoll含有accept的socket�Q�通过�q�种方式实现�q�接��C��的负载均衡（�q�接数少的工作进�E�得到accept锁的概率高）�?br />
��Z��避免大数据量io�Ӟ��et模式下只处理一个fd,其他fd被饿�ȝ��情况发生。linux��可以在fd联系到的�l�构�Q�一般都会自己封装一个包含fd和读写缓冲的�l�构体）中增加ready位，然后epoll_wait触发事�g之后仅将其置位�ؓready模式�Q�然后在下边轮询ready fd列表�?/span>

epoll实现�Q?
epoll内部用了一个红黑树记录��d��的socket�Q�用了一个双向链表接收内核触发的事�g�?/span>

注册的事件挂载在�U�黑树中(�U�黑树的插入旉��效率是logN�Q�其中n为树的高�?�?/span>

挂蝲的事件会与设�?�|�卡)驱动建立回调关系�Q�也��是��_��当相应的事�g发生时会调用�q�个回调�Ҏ��。这个回调方法在内核中叫ep_poll_callback,它会��发生的事�g��d��到rdlist双链表中�?/span>

使用mmap映射内存�Q�减��内核态和用户态的不同内存地址�I�间拯��开销�?/span>每次注册新的事�g到epoll中时�Q�会把fd拯��q�内核，通过内核于用��L��间mmap同一块内�?/span>保证了只会拷贝一�ơ。（�q�回的时候不需要拷贝，select要）

执行epoll_ctl�Ӟ��除了把socket攑ֈ��U�黑树上�Q�还会给内核中断处理�E�序注册一个回调函敎ͼ�告诉内核�Q�如果这个句柄的中断��C��Q�就把它攑ֈ�准备��q�Alist链表里。所以，当一个socket上有数据��C��Q�内核在把网卡上的数据copy到内�怸�后就把socket插入到准备就�l�链表里了。链表又是通过mmap映射的空��_��所以在传递给用户�E�序的时候不需要复�Ӟ��q�也是�ؓ什么比select效率高的原因�Q�epoll_wait�q�回的只是就�l�队列，不需要轮�?不需要复制完成的事�g列表�Q�select�Q�poll实现需要自�׃��断轮询所有fd集合�Q�直到设备就�l�）�?/span>

epoll_wait最后会��查socket�Q�如果是 LT�Q��ƈ且这些socket上确实有未处理的事�g�Ӟ��又把该句柄放回到刚刚清空的准备就�l�链表了�Q�LT比ET低效的原因）�?/span>

可见�Q�如果没有大量的�I�闲�Q�无效连接，epoll效率不比select高�?/span>

��试数据�Q�仅是刚接触go的时候好奇做的参考意义的��试�Q�：

同样的环境，echo服务器测�q�发io�Q�单�U�程epoll qps:45000左右�Q�每�q�接/协程 go�Q?50000多，多线�E�epoll�Q�开6个epoll�Q�每个epoll开8�U�程�Q�一�?8�U�程�Q�：qps 70000多�?/span>

clcl 2018-07-14 11:17 发表评论

tcp/udp�Q�socket那些事儿

clcl — Fri, 13 Jul 2018 07:49:00 GMT

概念 �Q? 
   tcp和udp�Q�连接和无连接都是协议，是共享物理介质的传输数据的应用程序之间的�U�定。面向连接的协议�l�护了segment的状态和�ơ序�?br />

故障 :
      默认无keep alive�Q?/span>

拔网�U�或�?/span>由器崩溃�Q�发送端���时�Q�重�?2�ơ大�U?分钟�Q�后攑ּ��Q�接收端读errorno ETIMEOUT�Q�如果没有读则要�{�到下一�ơ写��p�|sigpipe。如果中间�\由器无法转发则向源端发�?ICMP 目标��L��不可达�?/span>

�E�序退出（包括崩溃�Q�： �E�序退出和正常调用 close无法区分�Q�都会返回FIN表示退出，如果一端退出，
      另一端： 1.�W�一�ơ写合法�Q�接收到fin后还是能�l�箋发送数据）�W�二�ơ写的时候发现连接不存在�Q�得�?RST  RESET错误  2.�ȝ��时候得�? conn reset错误�Q����l�写则被SIGPIPE信号中止�Q�程序退出�?/span>

��L��宕机�Q?宕机后无法通过FIN通知�Ҏ���Q�对方会�l�箋重传直到timeout。如果超时前宕机的主机重启了�Q�此时收到重传的��L��没有�q�接记录�Q�向源返回rst�Q�发送端得到ECONNRESET错误�Q�如果发送端在读得到  conn reset错误�Q����l�写则被SIGPIPE信号中止�Q�程序退出�?/span>

开启keep alive情况下：

如果�E�序崩溃�q�回fin �Q?如果��L��可达但程序不存在�Q�主机重启）�Q�则响应RSt�Q�源端得到ECONNRESET 错误�?/span>

如果�Ҏ��没有对keep alive响应ACK 或者RST�Q�源端TIMEOUT�Q?/span>重试9�ơ，每次间隔75�U�，定时�?���时���时后的11.25分钟�Q?/span> 所以程序自己做心蟩�q�是必要的�?/span>

�l�节�Q?br />

tcp写操作：

用户态拷贝到内核态写�~�冲区后�q�回�Q�只�q�回明显错误�Q�socket无效或缓冲区无效。媄响的因素有：发送窗口，拥塞�H�口�Q�写�~�冲区大���，Nagle�?/span>

tcp是提高带宽利用率的协议，每次发送們֐�mss大小�Q�同时不能大于对端指定的大小�Q�发送窗口）�Q�tcp只考虑了网�l�中路由器缓冲区耗尽情况�Q�也是tcp的限�Ӟ��所以有拥塞�H�口和慢启动�Q��ؓ了防止网�l�拥塞（自律的协议）每次发送的不能大于�Ҏ��指定的（发送窗口）和自��q��自己限制的（拥塞�H�口�Q��?br />

    

慢启动：一开始指数��的增加拥塞窗口，��C��个门阀值后变成�U�性的�Q?之后每次��时都把门阀值降低到原来一半（�q�且rto��d��，TCP��时计算是RTOx2�Q�这栯��l�丢三次包就变成RTOx8了，十分恐�?/span>�Q�，拥塞�H�口讄��?重新开始慢启动�Q�指数��增加�Q�。一切都是�ؓ了让路由器有旉��处理�U�压的缓册Ӏ�（所以不适用于频�J�断开�q�接的移动网�l�，�q�也是�ؓ什么以前的下蝲工具开多条tcp传输速度更快的原因）�?/span>

Nagle��法�Q�第一�ơ（此时没有�{�待ack��认�Q�空闲连接）发送小包成功，�W�二�ơ��l�发�?�Q�哪怕发送窗口，拥塞�H�口都很大，之前的包没有ack��认依旧不让发直到收��C��前的 ack��认�?/span>

shutdown和close的区�?

close只是递减引用计数�Q?shutdown的半关闭会媄响所有的�q�程�?/span>

shutdown how=0  关闭读，��M���q�回eof

shutdown how=1  关闭写，��M��写会出错�Q�将�~�冲区的发送完后会发送fin表示没有数据了，

收到�Ҏ��发送的fin�Q�recv会返�?�?/span>

listen 的第二个参数制定的是全连接队列大���（accept�Q?br />

time_wait和close_wait 

time_wait  出现在主动close方，��Z��防止新连接收到旧链接的数据包�Q?数量�?/span>可以通过讄���内核参数�~�短旉���降低数��|��2msl�Q�。可以通过 SO_LINGER关闭�?/span>

close_wait 出现在被动close方，数量高一般因为性能或者bug在收到fin后没有调用close�?br />

SO_REUSEADDR

用于�E�序崩溃后重启，解决地址被占用问题（time_wait�Q�，另一个用途是开两个服务�Q�第一个制定地址�Q�第二个指定INADDR_ANY 通配地址�Q�如果客��L���q�接的是制定地址一样会到第一个socket上�?br />      对于�l�定于同一地址端口�l�合上的UDP socket�Q�kernel���试在它们之间��^均分配收到的数据包；对于�l�定于同一地址端口�l�合上的TCP监听socket�Q�kernel���试在它们之间��^均分配收到的�q�接��h���Q�调用accept()�Ҏ��所得到的请求）�?/span>

Nagle和�g�q�ack的问题：

发送端数据未发送完�Q�被nagle���止发送（必须�{�待接收端的ack�Q�也���是没有未确认的包才允许发送）�Q�此时接收端ack被�g�q�发送（希望���ack和数据一起发送提高带宽利用率�Q�而发送方数据未发送完��D��接收端无法回复，双方死锁�?/span>

已连接的UDP�Q?/span>

tcp的connect是开始三�ơ握手，���远�E�的ip端口�l�定到socket�Q�而bind是绑定本地的ip端口�?/span>

udp没有三次握手�Q�connect�U���a是本地行为，���远�E�的ip端口�l�定到socket上�?/span>

已连接的udp可以不用sendto�Q�sendto会先���socket和目的地址�q�接�Q�然后发送数据后再断开�Q�而已�q�接的已�l�绑定地址可以用write�Q�提高效率（资料昄���暂时�q�接断开所用的旉���是传输udp数据的三分之一�Q�还是很可观的）。异步错误的接收�Q���用sendto发送完�pȝ�����没有记录了�Q�应用程序无法接收之后icmp�q�回的错误�?/span>

接收端已�q�接udp的好处： 可以标识哪个socket是哪个用��P��另外�q�可以独占连接，再另一个地方调用recvfrom指定相同地址会返回ECONNREFUSED�Q�因为此�q�接已经被绑定�?/span>

clcl 2018-07-13 15:49 发表评论

初识cdn

clcl — Wed, 09 May 2018 15:57:00 GMT

   工作上虽然和cdn没关�p�M��是技术方向还是很多相��g��处的�Q�例如：负蝲均衡�Q�缓存，分布式，路由�{��?/span>
   cdn��单的说就是个复杂的大�~�存�Q�由于目标用��P��包括源和端）�q�泛直接��D��了其复杂性，遍布�q�节点多则需要分��负载甚臌��l�织�Q�应用繁杂则需要分��\由，提速则需要缓存，�E�_��则需要监控调度，��Z��透明则需要各�U�映��?/span>
�׃��接入面广和网�l�的复杂性，不可能让客户端直接面�Ҏ��Q�于是就有了专门接入客户端的边缘服务�?�l�，�q�些边缘服务器和后端的调度，监控�Q�源服务器通讯。既然是�~�存��?/span>涉及到数据一致性的问题�Q?/span>最��单的��是各接入端的边�~�服务器在需要的时候到后台拉取�Q�或者更��的他们之间可以相互拉取，甚至后台调度提前推送�?/span>
边缘接收到请求后首当其冲的问题就是对��h��的内�?“��d��?/span>”�?#8220;怎么�?/span>”�Q�想要知道内容的位置�Q�一般缓存的实现不外乎就是统一��C��个目录服务器找，或者广播所有自��q��道的节点问一圈，更高效的�Ҏ��是将��h��url哈希后直接找到目的地址�Q�当然只要是�~�存都会�q�期也就有TTL的概��c�?#8220;怎么�?#8221;的方式多�U�多��P��׃��互联�|�web服务居多��Z��DNS的�\�׃��用最�q�泛�Q�缺�Ҏ��客户端和中��点会�~�存�Q�更新需要一定时间。HTTP重定向，URL改写�Q�也有直接在�|�络讑֤�路由器上做，直接在�\��p��中保持�\径。这些方法在cdn�q�个庞杂的系�l�中�Ҏ��需要��用，例如边缘服务器�ؓ了接收到客户端的��h��可以使用dns重定向，然后再用哈希或者url改写转发到后端的源�?nbsp;
现如今的�|�络内容有许多是动态生成的�Q�对�q�些无法提前�~�存的内容可以直接略�q�只存静态内容（分段�~�存�Q�，�l�装的时候发送回客户端或者直接赋予边�~�服务器生成动态内容的能力�Q�边�~�计��）当然�q�对�|�页的制作有规范�?/span>
面向大众的服务都有潮汐效应，在热�Ҏ��D늚�讉K��量是�q�x��的几十上癑ր�（�Ҏ��二八理论�Q?0%的问题都是在20%的地方出现的�Q�热点访问量也是大多讉K��部分数据，如果能提前将热点�~�存于各边缘服务器最直接有效�Q�，如果有自适应的动态调整功能整个服务会健壮很多。边�~�服务器是离用户最�q�的�Q�可以将每个节点看成�l�，�l�长监控负蝲自适应的添加删除组员（�~�存服务器）以及更新dns�Q�不允许�l�员跨组拉数据。当然如果客��L��之间可以使用P2P�怺�取数据也是一个办法�?nbsp;
当前出现了基于流媒体的cdn�Q�视频内容分发在后端以文件的形式传输�Q�适合传输的格式更高效�Q�，到边�~�服务器再以��的形式和客��L��传输�Q�不需要全部传完即可开始播放）。同时也要综合考虑时段需求，视频�~�码�{�略也很重要�?/span>

clcl 2018-05-09 23:57 发表评论

clcl — Sun, 05 Feb 2017 06:08:00 GMT

dpdk是通过许多不同的纬度来加速包处理的，其中主要包括�Q?/span>

hugepage大页内存(�q�程使用的是虚拟地址�Q�一般页�?4k)能映��的虚拟地址�I�间有限�Q��用大��能减少换页�ơ数提高cache命中�Q�通过mmap把大��|��到用户态的虚拟地址�I�间有用�q�mmap的都知道�q�是实现�׃�n内存的手�D�，所以dpdk�q�支持多�q�程�׃�n内存)

cache预取 (每次预读当前数据盔R��前后的数�?�Q�批量操作数据，cache line寚w��(通过��费一点内存将要操作的数据寚w��)

接管了网卡用��h��驱动��用轮询而不是网卡中�?/span>

��网卡rx tx队列映射到用��h��空间实现真正的零拷贝（传统堆栈臛_��也得一�ơ拷贝，因�ؓ队列�I�间在内核而内核和用户态��用不同的地址�I�间�Q?传统堆栈��Z��支持通用性，例如ipx�{�其他网�l�，��包处理�q�程分了很多层次�Q�层之间的接口标准统一数据�l�构��需要�{换，无�Ş中带来了巨大的成本，如osi七层模型而实用的��是tcp/ip四层模型)

�U�程�l�定cpu

支持NUMA�Q�不同的core属于不同的node�Q�每个node有自��q��mempool减少冲突

无锁环�Ş队列(冲突发生时也是一�ơcas的开销)

dpdk通过tools/dpdk-setup.sh的脚本，通过�~�译、挂载内核模块， �l�定�|�卡�Q�先把网卡ifconfig down�Q�，讄��hugepage后就可以使用了�?/span>

在内核模块igb加蝲�Ӟ��会注册pci讑֤�驱动

static struct pci_driver igbuio_pci_driver = {

.name = "igb_uio",

.id_table = NULL,

.probe = igbuio_pci_probe,

.remove = igbuio_pci_remove,

};

在绑定网卡时�Q�会调用igbuio_pci_probe�Q��用用��h��驱动uio接管�|�卡(中断处理、mmap映射讑֤�内存到用��L��?

�pȝ��启动�Ӟ��bios会将讑֤��ȝ��地址信息记录�?sys/bus/pci/devices�Q�dpdk�E�序启动时会去这里扫描pci讑֤��Q�根据不同类型的NIC有对应的初始化流�E�。在后面配置队列的时候会把用��h��的队列内存地址通过��g指��o交给NIC�Q�从而实现零拯��?/span>

如果NIC收到包，会做标记�Q�轮询的时候通过标记取数据包

while (nb_rx < nb_pkts) {

* The order of operations here is important as the DD status

* bit must not be read after any other descriptor fields.

* rx_ring and rxdp are pointing to volatile data so the order

* of accesses cannot be reordered by the compiler. If they were

* not volatile, they could be reordered which could lead to

* using invalid descriptor fields when read from rxd.

rxdp = &rx_ring[rx_id];

staterr = rxdp->wb.upper.status_error;

if (! (staterr & rte_cpu_to_le_32(E1000_RXD_STAT_DD)))

break;

rxd = *rxdp;

发包的轮询就是轮询发包结束的��g标志位，��g发包完成会写回标志位�Q�驱动发现后再释攑֯�应的描述�W�和�~�冲块�?/span>

KNI

通过创徏一个虚拟网卡，��收到的包丢�l�协议栈

/* 发送skb到协议栈 */

/* Call netif interface */

netif_receive_skb(skb);

POWER

在负载小的时候没有必要��用轮询模式，�q�时可以打开�|�卡中断使用eventfd epoll通知用户�?/span>

Ring

无锁环�Ş队列的核心就是操作头��引，先将头尾索引赋给临时变量�Q�再把尾索引往后蟩n个位�|�，利用cas判断头如果还是在原来的位�|�就指向��֐�则就重复�q�个�q�程�Q�然后在操作中间跌��的n个元素就是安全的了，此时头尾索引应该指向同一个位�|�，如果不同应该是有别的�U�程也在操作�Q�重复等待即可�?�q�里有个�l�节�Q�烦引是只加不减的，因�ؓ是环形队列烦引又是unsigned 32bits�Q�所以每�ơ取数据前把索引模队列长�?1�Q?uint32_t mask; /**< Mask (size-1) of ring. */卛_��)

Windows下��用vmware虚拟机的时候出现EAL: Error reading from file descriptor�Q�根据网上的说法打了patch�q�是不行�Q�后来尝试挂载内核模块的时候不加蝲vfio模块��可以了

clcl 2017-02-05 14:08 发表评论

Redis解析

clcl — Tue, 24 Jan 2017 10:13:00 GMT

Redis是工作中很常用的�Q�这里将比较普遍使用的结构研�I�了下做个备忘�?/span>

hash

实现和dnspod的dataset半斤八两�Q�本质上是个二维数组�Q�通过��key哈希作�ؓ一�l�的下表�Q�第二维的数�l�存相同哈希的元素，查找使用遍历的方式，所以这里redis做了优化�Q�当满��条�g的时�?数组数量太大)会进行rehash�Q�动态扩大桶的数量来减少最后一�l�遍历的�ơ数.

函数名称	作用	复杂�?/span>
dictCreate	创徏一个新字典	O(1)
dictResize	重新规划字典的大��?/span>	O(1)
dictExpand	扩展字典	O(1)
dictRehash	对字典进行N步渐�q�式Rehash	O(N)
_dictRehashStep	对字典进�?步尝试Rehash	O(N)
dictAdd	��d��一个元�?/span>	O(1)
dictReplace	替换�l�定key的value�?/span>	O(1)
dictDelete	删除一个元�?/span>	O(N)
dictRelease	释放字典	O(1)
dictFind	查找一个元�?/span>	O(N)
dictFetchValue	通过key查找value	O(N)
dictGetRandomKey	随机�q�回字典中一个元�?/span>	O(1)

字典�l�构

typedef struct dict {

// �c�d��特定函数

dictType *type;

// �U�有数据

void *privdata;

// 哈希�?/span>

dictht ht[2];

// rehash 索引

// �?rehash 不在�q�行�Ӟ��gؓ -1

int rehashidx; /* rehashing not in progress if rehashidx == -1 */

// 目前正在�q�行的安全�P代器的数�?/span>

int iterators; /* number of iterators currently running */

} dict;

�q�里哈希表有两个�Q�一般都用ht[0]�Q�当需要rehash的时候会创徏一个比ht[0]大的 2 �?N �ơ方的ht[1]�Q�然后渐�q�式的将数据dictEntry�U�过�?除了定时的rehash�Q�在每次操作哈希表时都会_dictRehashStep)�Q�完成后��ht[1]替换ht[0]

zset

zset本质��是list,只不�q�每个元素都有若�q�个指向后��span长的指针�Q�这��L��单的设计大大提高了效率，使得可以比拟�q��二叉树，查找、删除、插入等操作都可以在�Ҏ��期望旉��内完成，�Ҏ��q��树，跌��表的实现要简单直观很多�?/span>

/* ZSETs use a specialized version of Skiplists */

* 跌��表节�?/span>

typedef struct zskiplistNode {

// 成员对象

robj *obj;

// 分�?/span>

double score;

// 后退指针

struct zskiplistNode *backward;

// �?/span>

struct zskiplistLevel {

// 前进指针

struct zskiplistNode *forward;

// 跨度

unsigned int span;

} level[];

} zskiplistNode;

* 跌��?/span>

typedef struct zskiplist {

// 表头节点和表��节�?/span>

struct zskiplistNode *header, *tail;

// 表中节点的数�?/span>

unsigned long length;

// 表中层数最大的节点的层�?/span>

int level;

} zskiplist;

* 有序集合

typedef struct zset {

// 字典�Q�键为成员，��gؓ分�?/span>

// 用于支持 O(1) 复杂度的按成员取分值操�?/span>

dict *dict;

// 跌��表，按分值排序成�?/span>

// 用于支持�q�_��复杂度�ؓ O(log N) 的按分值定位成员操�?/span>

// 以及范围操作

zskiplist *zsl;

} zset;

虽然�q�种方式排序查找很快�Q�但是修改的话就得多做些工作�?/span>

/* Delete an element with matching score/object from the skiplist.

* 从蟩跃表 zsl 中删除包含给定节�?score �q�且带有指定对象 obj 的节炏V�?/span>

* T_wrost = O(N^2), T_avg = O(N log N)

int zslDelete(zskiplist *zsl, double score, robj *obj)

intset

typedef struct intset {

uint32_t encoding; //所使用�c�d��的长度，4\8\16

uint32_t length; //元素个数

int8_t contents[]; //保存元素的数�l?/span>

} intset;

intset其实��是数组�Q�有序、无重复��C��存多个整数��|��查找用的是二分查�?* T = O(log N)�Q�添加的话在扑ֈ�对应的数�l�中应该存在的位子后使用memmove向后�U�d��I�Z��填补(当然需要先realloc预分配空�?�Q�同理删除也是用memmove向前�U�d��

set

当��用整数时�Q��用intset�Q�否则��用哈希表

其他的关于网�l�事件处理，epoll�Q�回调，拆包都和正常使用差不多，关于错误处理EINTR(�pȝ��调用期间发生中断)和EAGAIN �l�箋重试而如果是EPOLLHUP或EPOLLERR则让io该读读该写写�Q�有错处理就是了�?/span>

clcl 2017-01-24 18:13 发表评论

dnspod解析

clcl — Mon, 23 Jan 2017 07:14:00 GMT

dns的递归解析�q�程�q�是挺繁琐的�Q�要知道一个域名可能有cname、ns 而请求的cname、ns可能�q�有cname、ns�Q�如果按照线性的处理每个��h��那逻辑��变成毛�U�团�?/span>

dnspod的处理还是挺巧妙的，通过一个公��q��数据集dataset��所有域名对应的a、cname、ns�{�类型的数据作�ؓ单独的条目存入，当有需要某个域名的信息时先去dataset找，找不到在加入qlist��h��根，有专门的�U�程不间断的��qlist轮询dataset找（�q�里只要�ơ数允许�Q�没得到惌��的结果就轮询所有qlist到dataset找虽然可以简化逻辑分离的彻底但是会是个性能瓉��Q�后面有�Ҏ��Q�当根返回以后只是简单的��记�?通常是一个域名的cname、ns或者a)存入dataset(而不是��l�流�E�，因�ؓ�Ҏ��q�个�q�回是cname�q�是ns或者a处理不同逻辑复杂�Q�而这样处理对于用到相同域名的��h��q�有优化作用)�Q�剩下的工作交给那边不间断轮询的�U�程

Dnspod主要�?个run�Q�若�q�个�U�程�Q�组�?/span>

run_sentinel 监听53端口接收客户端请求，��请求放到队列中

run_fetcher 从队列中取出��h��Q�根据qname取得最后一�U�cname�Q�查看本地dataset 是否有记录，如果有则�q�回�Q�没有则��该��h��攑օ�qlist�?/span>

run_quizzer

1.不间断的遍历qlist�Q�只要状态�ؓPROCESS_QUERY�?/span>dataset中没有的��向对应的根发送请求�?/span>

2.通过epoll�{�待根返回，解析�q�回的数据加�?dataset

3.��查记录的ttl�Q�在��记录加入dataset时还会将�q�些记录以红黑树的�Ş式组�l��v来，取得ttl最早到期的�Q�将其放入qlist中等待刷斎ͼ�注意�q�里不是删除�Q�如果收不到不返回则该记录一直存�?/span>

关于dataset的实�?/span>

dataset是��用哈希表实现的，本质上是个二�l�数�l�，��域名哈希成一个��|��模上数组的数量作��Z��标，扑ֈ�对应的数�l�接着遍历查找�Q�根据需要可以扩大数�l�的数量提升性能�?/span>

我们的优化手�D?/span>

之前提到dnspod的qlist会不间断轮询�Q�属于主动查询，�Ҏ��能有不��的影响�Q�这里我们采取的做法是被�?�c�M��回调的方�?�Q�我们将��h��的域名和�c�d��分类�Q�相同的攑֜�一�l�，当dataset找不到向根发��求后我们�q�不每次��d��轮询�Q�而是在等到应�{�后�Q�触发该域名和类型的��h��l�，让他们根据自��q��逻辑��C��一步（一般是先找该域名的最后一�U�cname�Q�根据这个cname查是否存在他的对应请求类型的记录�Q�一般是a或者ns�Q�如果没有，则找�q�个cname的ns�Q?/span>

以上可以看出dataset很重要，负蝲也不��，�q�经帔R��要�ƈ发访问，�q�里我们每次接收到根的回复后�Q�除了将记录的答案加�q�dataset�Q�还创徏一个��时的dataset�Q�只存该�ơ回复的信息�Q�在后面的流�E�会优先到这里去找，没有的再找dataset�?/span>

clcl 2017-01-23 15:14 发表评论

Network Stack Specialization for Performance

clcl — Sun, 22 Jan 2017 10:01:00 GMT

摘要: 最�q�在研究DPDK�Q�这是sigcomm 2014的论文，�U�录在此备忘Ps: 文中关键词的概念�Q�segment : 对应于tcp的PDU(协议传输单元)�Q�这里应该指tcp层的包，如果一个包太大tcp负责��它拆分成多个segment�Q�这个概念对理解后文有帮助）�Ҏ��unix�|�络�~�程�? �W?��|��?�Q�packet是IP层传递给链�\层�ƈ且由链�\层打包好��装在��中的数据�Q�不包括帧头�Q�而IP层的�?.. 阅读全文

clcl 2017-01-22 18:01 发表评论

cegui 0.7 渲染改动

clcl — Tue, 27 Apr 2010 12:56:00 GMT

一直想用cegui�Q�但是没��Z��用，只是抽空看其代码

最�q�听朋友�?.7 debug下��数提�?00多，挺惊讶的�Q�重新到久违了的官网上下�?.7.1

看了下渲染的实现(GL)

首先�Q�添加了GeometryBuffer玩意�Q��得每个window保存了属于自��q��点和纹理信�?/p>

然后在RenderingSurface中有GeometryBuffer队列�Q��得每个拥有AutoRenderingSurface属性的window有属于自��q��队列(默认只有FrameWindow才有)

而在drawself中执行的则是先通过looknfeel�Q�把需要渲染的信息丢到每个部�g自己的GeometryBuffer里，然后把GeometryBuffer丢到RenderingSurface的队列中(一般�ؓ

FrameWindow的GeometryBuffer队列�Q�每个面板就有自��q��渲染队列�?

要知道以往都是只有一个队列的�Q�要渲染啥直接往里塞�?�?�?br>�q�样一改就不必每个��部件有更改都要全部重新清空渲染�?/p>

再往后就是把每个�H�口队列里的GeometryBuffer渲染到各自的RenderingSurface表面上，�q�里要注意的是�ƈ不是渲染到屏�q�上而是表面上，cegui在这里��用了渲染到纹理，GL

用的是fbo实现的�?/p>

注意RenderingSurface只有两个来源�Q�一是通过讄��AutoRenderingSurface属性，另一个就是RenderingRoot了，RenderingRoot只有一个，在render中，通过�W�一个来源的�?/p>

用的是fbo的渲染，而第二个来源则直接渲染到屏幕了�?/p>

所有的�q�些执行完后��可以渲染到屏幕了，通过RenderingRoot执行�Q�注意这里的RenderingRoot中的RenderTarget和之前的不一��P��q�里用的是OpenGLViewportTarget而不�?/p>

OpenGLFBOTextureTarget�?br>

clcl 2010-04-27 20:56 发表评论

[转]理解�Ҏ��

clcl — Sun, 25 Oct 2009 09:15:00 GMT

摘要: �q�个看代码里面batch相关的。[Direct3D] 实现�Ҏ��渲染、硬�?T&L 的渲染器�?D3DPipeline 在是否从 D3DRender 提供��点�~�存区操作给��水�U�时做了一些权衡，最后决定暂时��?IDirect3DDevice9::DrawPrimitiveUP 来渲染，因�ؓ它更�Ҏ��书写�Q�而且开销是一�ơ顶�Ҏ��贝，��水�U�也不用操心对缓存的使用�?(DrawPrimitive�?.. 阅读全文

clcl 2009-10-25 17:15 发表评论

亚洲日本一区二区三区,国产精品成人一区二区,亚洲精品在线三区

���博客搬至CSDN

epoll那些事儿

tcp/udp�Q�socket那些事儿

初识cdn

Redis解析

dnspod解析

Network Stack Specialization for Performance

cegui 0.7 渲染改动

[转]理解�Ҏ��

��博客搬至CSDN