>> »¶ÓÄú ¿ÍÈË: µÇÂ¼ | ×¢²á | ÔÚÏß | ËÑË÷ | ·ç¸ñ | °ïÖú | Í³¼Æ | ÎÄÕÂ

·µ»ØÊ×Ò³

>>ÓëÈí¼þ¿ª·¢ÓÐ¹ØµÄÖªÊ¶£º²Ù×÷ÏµÍ³£¬Êý¾Ý¿â£¬ÍøÂçÍ¨ÐÅµÈ

Êé¼®Ö§³Ö

ÎÀÇÙÖ±²¥

Java¼¼ÊõÍøÕ¾ ¡ú ¡º Java¿ª·¢¼¼Êõ ¡» ¡ú ¡º ²Ù×÷ÏµÍ³¡¢ÍøÂç¼Ü¹¹ºÍÊý¾Ý¿â×¨Ìâ ¡» ¡ú ´ÓÔÀíµ½ÊµÕ½£ºÈçºÎÍ¨¹ý²¼Â¡¹ýÂËÆ÷·ÀÖ¹»º´æ»÷´©

ÄúÊÇ±¾ÎÄÕÂµÚ 19951 ¸öÔÄ¶ÁÕß

* Ìù×ÓÖ÷Ìâ: ´ÓÔÀíµ½ÊµÕ½£ºÈçºÎÍ¨¹ý²¼Â¡¹ýÂËÆ÷·ÀÖ¹»º´æ»÷´©

µãÔÞ(0) ÊÕ²Ø

×÷Õß:javathinker ·¢±íÊ±¼ä£º2020-03-11 13:20:57

ÏûÏ¢

²é¿´

ËÑË÷

ºÃÓÑ

¸´ÖÆ

ÒýÓÃ

ÎªÊ²Ã´ÒýÈë

ÎÒÃÇµÄÒµÎñÖÐ¾³£»áÓöµ½´©¿âµÄÎÊÌâ£¬Í¨³£¿ÉÒÔÍ¨¹ý»º´æ½â¾ö¡£Èç¹ûÊý¾ÝÎ¬¶È±È½Ï¶à£¬½á¹ûÊý¾Ý¼¯ºÏ±È½Ï´óÊ±£¬»º´æµÄÐ§¹û¾Í²»Ã÷ÏÔÁË¡£

Òò´ËÎªÁË½â¾ö´©¿âµÄÎÊÌâ£¬ÎÒÃÇÒýÈëBloom Filter¡£

ÊÊºÏµÄ³¡¾°

Êý¾Ý¿â·ÀÖ¹´©¿â Google Bigtable£¬Apache HBaseºÍApache CassandraÒÔ¼°Postgresql Ê¹ÓÃBloomFilterÀ´¼õÉÙ²»´æÔÚµÄÐÐ»òÁÐµÄ´ÅÅÌ²éÕÒ¡£

±ÜÃâ´ú¼Û¸ß°ºµÄ´ÅÅÌ²éÕÒ»á´ó´óÌá¸ßÊý¾Ý¿â²éÑ¯²Ù×÷µÄÐÔÄÜ¡£ÈçÍ¬Ò»¿ªÊ¼µÄÒµÎñ³¡¾°¡£Èç¹ûÊý¾ÝÁ¿½Ï´ó£¬²»·½±ã·ÅÔÚ»º´æÖÐ¡£ÐèÒª¶ÔÇëÇó×öÀ¹½Ø·ÀÖ¹´©¿â¡£
»º´æå´»ú »º´æå´»úµÄ³¡¾°£¬Ê¹ÓÃ²¼Â¡¹ýÂËÆ÷»áÔì³ÉÒ»¶¨³Ì¶ÈµÄÎóÅÐ¡£

ÔÒòÊÇ³ýÁËBloom Filter ±¾ÉíÓÐÎóÅÐÂÊ£¬å´»úÖ®Ç°µÄ»º´æ²»Ò»¶¨ÄÜ¸²¸Çµ½ËùÓÐDBÖÐµÄÊý¾Ý£¬µ±å´»úºóÓÃ»§ÇëÇóÁËÒ»¸öÒÔÇ°´ÓÎ´ÇëÇóµÄÊý¾Ý£¬Õâ¸öÊ±ºò¾Í»á²úÉúÎóÅÐ¡£

µ±È»£¬»º´æå´»úÊ±Ê¹ÓÃ²¼Â¡¹ýÂËÆ÷×÷ÎªÓ¦¼±µÄ·½Ê½£¬ÕâÖÖÇé¿öÓ¦¸ÃÒ²ÊÇ¿ÉÒÔÈÌÊÜµÄ¡£
WEBÀ¹½ØÆ÷ ÏàÍ¬ÇëÇóÀ¹½Ø·ÀÖ¹±»***¡£ÓÃ»§µÚÒ»´ÎÇëÇó£¬½«ÇëÇó²ÎÊý·ÅÈëBloomFilterÖÐ£¬µ±µÚ¶þ´ÎÇëÇóÊ±£¬ÏÈÅÐ¶ÏÇëÇó²ÎÊýÊÇ·ñ±»BloomFilterÃüÖÐ¡£¿ÉÒÔÌá¸ß»º´æÃüÖÐÂÊ
¶ñÒâµØÖ·¼ì²â chrome ä¯ÀÀÆ÷¼ì²éÊÇ·ñÊÇ¶ñÒâµØÖ·¡£Ê×ÏÈÕë¶Ô±¾µØBloomFilter¼ì²éÈÎºÎURL£¬²¢ÇÒ½öµ±BloomFilter·µ»Ø¿Ï¶¨½á¹ûÊ±²Å¶ÔËùÖ´ÐÐµÄURL½øÐÐÈ«Ãæ¼ì²é£¨²¢ÇÒÓÃ»§¾¯¸æ£¬Èç¹ûËüÒ²·µ»Ø¿Ï¶¨½á¹û£©¡£
±ÈÌØ±Ò¼ÓËÙ bitcoin Ê¹ÓÃBloomFilterÀ´¼ÓËÙÇ®°üÍ¬²½¡£

¿ªÔ´ÏîÄ¿µØÖ·£º https://github.com/luw2007/bloomfilter

ÎÒÃÇÏÈ¿´¿´ Ò»°ãÒµÎñ»º´æÁ÷³Ì£º µã»÷ÔÚÐÂ´°¿ÚÖÐä¯ÀÀÔÍ¼
CTRL+Êó±ê¹öÂÖ·Å´ó»òËõÐ¡

ÏÈ²éÑ¯»º´æ£¬»º´æ²»ÃüÖÐÔÙ²éÑ¯Êý¾Ý¿â¡£È»ºó½«²éÑ¯½á¹û·ÅÔÚ»º´æÖÐ¼´Ê¹Êý¾Ý²»´æÔÚ£¬Ò²ÐèÒª´´½¨Ò»¸ö»º´æ£¬ÓÃÀ´·ÀÖ¹´©¿â¡£

ÕâÀïÐèÒªÇø·ÖÒ»ÏÂÊý¾ÝÊÇ·ñ´æÔÚ¡£Èç¹ûÊý¾Ý²»´æÔÚ£¬»º´æÊ±¼ä¿ÉÒÔÉèÖÃÏà¶Ô½Ï¶Ì£¬·ÀÖ¹ÒòÎªÖ÷´ÓÍ¬²½µÈÎÊÌâ£¬µ¼ÖÂÎÊÌâ±»·Å´ó¡£

Õâ¸öÁ÷³ÌÖÐ´æÔÚ±¡ÈõµÄÎÊÌâÊÇ£¬µ±ÓÃ»§Á¿Ì«´óÊ±£¬ÎÒÃÇ»á»º´æ´óÁ¿Êý¾Ý¿ÕÊý¾Ý£¬²¢ÇÒÒ»µ©À´Ò»²¨ÀäÓÃ»§£¬»áÔì³ÉÑ©±ÀÐ§Ó¦¡£

¶ÔÓÚÕâÖÖÇé¿ö£¬ÎÒÃÇ²úÉúµÚ¶þ¸ö°æ±¾Á÷³Ì: redis¹ýÂËÀäÓÃ»§»º´æÁ÷³Ì µã»÷ÔÚÐÂ´°¿ÚÖÐä¯ÀÀÔÍ¼
CTRL+Êó±ê¹öÂÖ·Å´ó»òËõÐ¡

ÎÒÃÇ½«Êý¾Ý¿âÀïÃæÖÐÃüÖÐµÄÓÃ»§·ÅÔÚredisµÄsetÀàÐÍÖÐ£¬ÉèÖÃ²»¹ýÆÚ¡£ÕâÑùÏàµ±°Ñredisµ±×÷Êý¾Ý¿âµÄË÷Òý£¬Ö»Òª²éÑ¯redis£¬¾Í¿ÉÒÔÖªµÀÊÇ·ñÊý¾Ý´æÔÚ¡£

redisÖÐ²»´æÔÚ¾Í¿ÉÒÔÖ±½Ó·µ»Ø½á¹û¡£Èç¹û´æÔÚ¾Í°´ÕÕÉÏÃæÌáµ½

Ò»°ãÒµÎñ»º´æÁ÷³Ì

´¦Àí¡£

´ÏÃ÷µÄÄã¿Ï¶¨»áÏëµ½¸ü¶àµÄÎÊÌâ£º

redis±¾Éí¿ÉÒÔ×ö»º´æ£¬ÎªÊ²Ã´²»Ö±½Ó·µ»ØÊý¾ÝÄØ£¿
Èç¹ûÊý¾ÝÁ¿±È½Ï´ó£¬µ¥¸öset£¬»áÓÐÐÔÄÜÎÊÌâ£¿
ÒµÎñ²»ÖØÒª£¬½«È«Á¿Êý¾Ý·ÅÔÚredisÖÐ£¬Õ¼ÓÃ·þÎñÆ÷´óÁ¿ÄÚ´æ¡£Í¶Èë²ú³ö²»³É±ÈÀý£¿

ÎÊÌâ1ÐèÒªÇø·ÖÒµÎñ³¡¾°£¬½á¹ûÊý¾ÝÉÙ£¬ÎÒÃÇÊÇ¿ÉÒÔÖ±½ÓÊ¹ÓÃredis×÷Îª»º´æ£¬Ö±½Ó·µ»ØÊý¾Ý¡£½á¹û±È½Ï´ó¾Í²»Ì«ÊÊºÏÓÃredis´æ·ÅÁË¡£±ÈÈçugcÄÚÈÝ£¬Ò»¸öÆÀÂÛÀïÃæ¿ÉÄÜ´æÔÚÉÏÍò×Ö£¬ÒµÎñ×Ö¶Î¶à¡£

redisÊ¹ÓÃÓÐºÜ¶à¼¼ÇÉ¡£bigkey Î£º¦±È½Ï´ó£¬ÎÞÂÛÊÇÀ©ÈÝ»òËõÈÝ´øÀ´µÄÄÚ´æÉêÇëÊÍ·Å£¬ »¹ÊÇ²éÑ¯ÃüÁîÊ¹ÓÃ²»µ±µ¼ÖÂ´óÁ¿Êý¾Ý·µ»Ø£¬¶¼»áÓ°ÏìredisµÄÎÈ¶¨¡£ÕâÀï¾Í²»Ï¸Ì¸ÔÒò¼°Î£º¦ÁË¡£

½â¾öbigkey ·½·¨ºÜ¼òµ¥¡£ÎÒÃÇ¿ÉÒÔÊ¹ÓÃhashº¯ÊýÀ´·ÖÍ°£¬½«Êý¾Ý·ÖÉ¢µ½¶à¸ökeyÖÐ¡£¼õÉÙµ¥¸ökeyµÄ´óÐ¡£¬Í¬Ê±²»Ó°Ïì²éÑ¯Ð§ÂÊ¡£

ÎÊÌâ3ÊÇredis´æ´¢Õ¼ÓÃÄÚ´æÌ«´ó¡£Òò´ËÎÒÃÇÐèÒª¼õÉÙÄÚ´æÊ¹ÓÃ¡£ÖØÐÂË¼¿¼Ò»ÏÂÒýÈëredisµÄÄ¿µÄ¡£redisÏñÒ»¸ö¼¯ºÏ£¬Õû¸öÒµÎñ¾ÍÊÇÑéÖ¤ÇëÇóµÄ²ÎÊýÊÇ·ñÔÚ¼¯ºÏÖÐ¡£ µã»÷ÔÚÐÂ´°¿ÚÖÐä¯ÀÀÔÍ¼
CTRL+Êó±ê¹öÂÖ·Å´ó»òËõÐ¡

Õâ¸ö½á¹¹¾ÍÏñÏ´ÔèµÄÊ±ºòÓÃµÄË«Ïò·§ÃÅ£º×ó±ßÈÈË®£¬ÓÒ±ßÀäË®¡£

´ó²¿·ÖµÄ±à³ÌÓïÑÔ¶¼ÄÚÖÃÁËfilter¡£ÄÃ python¾ÙÀý£¬filterº¯ÊýÓÃÓÚ¹ýÂËÐòÁÐ£¬ ¹ýÂËµô²»·ûºÏÌõ¼þµÄÔªËØ£¬·µ»ØÓÉ·ûºÏÌõ¼þÔªËØ×é³ÉµÄÁÐ±í¡£

ÎÒÃÇ¿´¸öÀý×Ó£º

$ python2
Python 2.7.10 (default, Oct 6 2017, 22:29:07)
[GCC 4.2.1 Compatible Apple LLVM 9.0.0 (clang-900.0.31)] on darwin
Type "help", "copyright", "credits" or "license" for more information.
>>> s = {2, 4}
>>> filter(lambda x:x in s, [0, 1, 2])
[2]

¼¯ºÏsÖÐ´æÔÚ 2£¬4Á½¸öÊý×Ö£¬ÎÒÃÇÐèÒª²éÑ¯ 0£¬1£¬2 ÄÇÐ©ÔÚ¼¯ºÏsÖÐ¡£

lambda x:x in s

¹¹ÔìÒ»¸öÄäÃûº¯Êý£¬ÅÐ¶ÏÈë²ÎxÊÇ·ñÔÚ¼¯ºÏsÖÐ¡£¹ýÂËÆ÷filterÒÀ´Î¶ÔÁÐ±íÖÐµÄÊý×ÖÖ´ÐÐÄäÃûº¯Êý¡£×îÖÕ·µ»ØÁÐ±í[2]¡£

redisÖÐÊµÏÖsetÓÃÁËÁ½ÖÖ½á¹¹£ºintsetºÍhash table¡£·ÇÊý×Ö»òÕß´óÁ¿Êý×ÖÊ±¶¼»áÍË»¯³Éhash table¡£ÄÇÃ´ÊÇ·ñºÃµÄËã·¨¿ÉÒÔ½ÚÊ¡hash tableµÄ´óÐ¡ÄØ£¿

ÆäÊµÔçÔÚ1970ÄêÓÉ Burton Howard BloomÌá³öµÄ²¼Â¡¹ýÂËÆ÷£¨Ó¢Óï£ºBloom Filter£©¡£ËüÊµ¼ÊÉÏÊÇÒ»¸öºÜ³¤µÄ¶þ½øÖÆÏòÁ¿ºÍÒ»ÏµÁÐËæ»úÓ³Éäº¯Êý¡£²¼Â¡¹ýÂËÆ÷¿ÉÒÔÓÃÓÚ¼ìË÷Ò»¸öÔªËØÊÇ·ñÔÚÒ»¸ö¼¯ºÏÖÐ¡£

ËüµÄÓÅµãÊÇ¿Õ¼äÐ§ÂÊºÍ²éÑ¯Ê±¼ä¶¼Ô¶Ô¶³¬¹ýÒ»°ãµÄËã·¨£¬ È±µãÊÇÓÐÒ»¶¨µÄÎóÊ¶±ðÂÊºÍÉ¾³ýÀ§ÄÑ¡£

BloomFilterÔÀí

ÎÒÃÇ³£¼ûµÄ½«ÒµÎñ×Ö¶ÎÆ´½ÓÖ®ºómd5£¬·ÅÔÚÒ»¸ö¼¯ºÏÖÐ¡£md5Éú³ÉÒ»¸ö¹Ì¶¨³¤¶ÈµÄ128bitµÄ´®¡£Èç¹ûÎÒÃÇÓÃbitmapÀ´±íÊ¾£¬ÔòÐèÒª

2**128 = 340282366920938463463374607431768211456 bit

ÅÐ¶ÏÒ»¸öÖµÔÚ²»ÔÚ£¬¾Í±ä³ÉÔÚÕâ¸öbitmapÖÐÅÐ¶ÏËùÔÚÎ»ÊÇ·ñÎª1¡£µ«ÊÇÎÒÃÇÈ«ÊÀ½çµÄ»úÆ÷´æ´¢¿Õ¼äÒ²ÎÞ·¨´æ´¢ÏÂÔØ¡£Òò´ËÎÒÃÇÖ»ÄÜ·ÖÅäÓÐÏÞµÄ¿Õ¼äÀ´´æ´¢¡£±ÈÈç:

        import crc32

def  BloomFilter( sample,  size,  hash_size = 1):
        # ¹¹ÔìÒ»¸öhashº¯Êý£¬½«ÊäÈëÊý¾ÝÉ¢ÁÐµ½sizeÒ»¸öÎ»ÖÃÉÏ
       hash  =  lambda  x:crc32( str(x).encode()) %size
      collision, s  =  0,  set()
       for i  in  range(sample):
            k  =  set()
             for j  in  range(hash_size):
                  k.add( hash(i +j *size /hash_size))
              # Ö»ÓÐËùÓÐÉ¢ÁÐ½á¹ûk¶¼ÔÚsÖÐ£¬²ÅÈÏÎªiÖØ¸´
             if  not k  - s:
                  collision  +=  1
                   continue
              # ½«É¢ÁÐ½á¹ûk¸üÐÂµ½¼¯ºÏsÖÐ
            s  |= k
       return collision

µ±Ö»ÓÐÒ»¸öhashº¯ÊýÊ±£ººÜÈÝÒ×·¢Éú³åÍ»¡£   µã»÷ÔÚÐÂ´°¿ÚÖÐä¯ÀÀÔÍ¼
CTRL+Êó±ê¹öÂÖ·Å´ó»òËõÐ¡

¿ÉÒÔ¿´µ½ÉÏÃæ1ºÍ2µÄhash½á¹û¶¼ÊÇ7£¬·¢Éú³åÍ»¡£Èç¹ûÔö¼Óhashº¯Êý£¬»á·¢ÉúÊ²Ã´Çé¿ö£¿

µã»÷ÔÚÐÂ´°¿ÚÖÐä¯ÀÀÔÍ¼
CTRL+Êó±ê¹öÂÖ·Å´ó»òËõÐ¡

ÎÒÃÇÊ¹ÓÃ¸ü¶àµÄhashº¯ÊýºÍ¸ü´óµÄÊý¾Ý¼¯ºÏÀ´²âÊÔ¡£µÃµ½ÏÂÃæÕâÕÅ±í µã»÷ÔÚÐÂ´°¿ÚÖÐä¯ÀÀÔÍ¼
CTRL+Êó±ê¹öÂÖ·Å´ó»òËõÐ¡

ÓÉ´Ë¿ÉÒÔ¿´µ½µ±Ôö¼Óhash·½·¨ÄÜ¹»ÓÐÐ§µÄ½µµÍÅö×²»úÂÊ¡£±È½ÏºÃµÄÊý¾ÝÈçÏÂ£º µã»÷ÔÚÐÂ´°¿ÚÖÐä¯ÀÀÔÍ¼
CTRL+Êó±ê¹öÂÖ·Å´ó»òËõÐ¡

µ«ÊÇÔö¼ÓÁËhash·½·¨Ö®ºó£¬»á½µµÍ¿Õ¼äµÄÊ¹ÓÃÐ§ÂÊ¡£µ±¼¯ºÏÕ¼ÓÃ×ÜÌå¿Õ¼ä´ïµ½25%µÄÊ±ºò£¬ Ôö¼Óhash µÄÐ§¹ûÒÑ¾²»Ã÷ÏÔ

µã»÷ÔÚÐÂ´°¿ÚÖÐä¯ÀÀÔÍ¼
CTRL+Êó±ê¹öÂÖ·Å´ó»òËõÐ¡

ÉÏÃæµÄÊ¹ÓÃ¶à¸öhash·½·¨À´½µµÍÅö×²¾ÍÊÇBloomFilterµÄºËÐÄË¼Ïë¡£

Ëã·¨ÓÅµã£º

Êý¾Ý¿Õ¼äÐ¡£¬²»ÓÃ´æ´¢Êý¾Ý±¾Éí¡£

Ëã·¨±¾ÉíÈ±µã£º

ÔªËØ¿ÉÒÔÌí¼Óµ½¼¯ºÏÖÐ£¬µ«²»ÄÜ±»É¾³ý¡£
Æ¥Åä½á¹ûÖ»ÄÜÊÇ¡°¾ø¶Ô²»ÔÚ¼¯ºÏÖÐ¡±£¬²¢²»ÄÜ±£Ö¤Æ¥Åä³É¹¦µÄÖµÒÑ¾ÔÚ¼¯ºÏÖÐ¡£
µ±¼¯ºÏ¿ìÂúÊ±£¬¼´½Ó½üÔ¤¹À×î´óÈÝÁ¿Ê±£¬Îó±¨µÄ¸ÅÂÊ»á±ä´ó¡£
Êý¾ÝÕ¼ÓÃ¿Õ¼ä·Å´ó¡£Ò»°ãÀ´Ëµ£¬¶ÔÓÚ1£¥µÄÎó±¨¸ÅÂÊ£¬Ã¿¸öÔªËØÉÙÓÚ10±ÈÌØ£¬Óë¼¯ºÏÖÐµÄÔªËØµÄ´óÐ¡»òÊýÁ¿ÎÞ¹Ø¡£²éÑ¯¹ý³Ì±äÂý£¬hashº¯ÊýÔö¶à£¬µ¼ÖÂÃ¿´ÎÆ¥Åä¹ý³Ì£¬ÐèÒª²éÕÒ¶à¸öÎ»£¨hash¸öÊý£©À´È·ÈÏÊÇ·ñ´æÔÚ¡£

¶ÔÓÚBloomFilterµÄÓÅµãÀ´Ëµ£¬È±µã¶¼¿ÉÒÔºöÂÔ¡£±Ï¾¹Ö»ÐèÒªkNµÄ´æ´¢¿Õ¼ä¾ÍÄÜ´æ´¢N¸öÔªËØ¡£¿Õ¼äÐ§ÂÊÊ®·ÖÓÅÐã¡£

ÈçºÎÊ¹ÓÃBloomFilter

BloomFilter ÐèÒªÒ»¸ö´óµÄbitmapÀ´´æ´¢¡£¼øÓÚÄ¿Ç°¹«Ë¾ÏÖ×´£¬×îºÃµÄ´æ´¢ÈÝÆ÷ÊÇredis¡£´Ógithub topics: bloom-filterÖÐ¾¹ý¼òµ¥µÄµ÷ÑÐ¡£

redis¼¯³ÉBloomFilter·½°¸£º

ÔÉúpython µ÷ÓÃsetbit ¹¹Ôì BloomFilter
lua½Å±¾
Rebloom - Bloom Filter Module for Redis (×¢£ºredis ModuleÔÚredis4.0ÒýÈë)
Ê¹ÓÃhiredis µ÷ÓÃredis pyreBloom

ÔÉúpython ·½·¨Ì«Âý£¬lua½Å±¾ºÍmodule ²¿Êð±È½ÏÂé·³¡£ÓÚÊÇÎÒÃÇÍÆ¼öÊ¹ÓÃpyreBloom£¬µ×²ãÊ¹ÓÃ¡£

pyreBloom:master  ¦Ë  ls
Makefile            bloom.h              bloom.pxd          murmur.c            pyreBloom.pyx
bloom.c              bloom.o              main.c                pyreBloom.c
´ÓÎÄ¼þÃüÃûÉÏ¿ÉÒÔ¿´µ½bloom Ê¹ÓÃc±àÐ´¡£pyreBloom Ê¹ÓÃcython±àÐ´¡£

bloom.h ÀïÃæÊµÏÖBloomFilterµÄºËÐÄÂß¼£¬Íê³ÉÓëredis serverµÄ½»»¥£»hashº¯Êý£»Ìí¼Ó£¬¼ì²éºÍÉ¾³ý·½·¨µÄÊµÏÖ¡£

        int  init_pyrebloom(pyrebloomctxt * ctxt,  char * key,  uint32_t capacity,  double error,  char* host,  uint32_t port,  char* password,  uint32_t db);
int  free_pyrebloom(pyrebloomctxt * ctxt);

int  add(pyrebloomctxt * ctxt,  const  char * data,  uint32_t len);
int  add_complete(pyrebloomctxt * ctxt,  uint32_t count);

int  check(pyrebloomctxt * ctxt,  const  char * data,  uint32_t len);
int  check_next(pyrebloomctxt * ctxt);

int delete(pyrebloomctxt * ctxt);

pyreBloom.pyx

        import math
import random

cimport bloom

     class  pyreBloomException( Exception):
  '''Some sort of exception has happened internally '''
pass

    cdef  class  pyreBloom( object):
cdef bloom.pyrebloomctxt context
cdef  bytes                      key

property bits:
def  __get__( self):
return  self.context.bits

property hashes:
def  __get__( self):
return  self.context.hashes

def  __cinit__( self,  key,  capacity,  error,  host =  '127.0.0.1 ',  port = 6379,
password =  ' ',  db = 0):
self.key  = key
if bloom.init_pyrebloom( & self.context,  self.key, capacity,
error, host, port, password, db):
raise pyreBloomException( self.context.ctxt.errstr)

def  __dealloc__( self):
bloom.free_pyrebloom( & self.context)

def  delete( self):
bloom.delete( & self.context)

def  put( self,  value):
if  getattr(value,   '__iter__ ',  False):
r  =
r  = bloom.add_complete( & self.context,  len(value))
else:
bloom.add( & self.context, value,  len(value))
r  = bloom.add_complete( & self.context,  1)
if r  <  0:
raise pyreBloomException( self.context.ctxt.errstr)
return r

def  add( self,  value):
return  self.put(value)

def  extend( self,  values):
return  self.put(values)

def  contains( self,  value):
  # If the object is 'iterable'...
if  getattr(value,   '__iter__ ',  False):
r  =
r  =
if ( min(r)  <  0):
raise pyreBloomException( self.context.ctxt.errstr)
return [v  for v, included  in  zip(value, r)  if included]
else:
bloom.check( & self.context, value,  len(value))
r  = bloom.check_next( & self.context)
if (r  <  0):
raise pyreBloomException( self.context.ctxt.errstr)
return  bool(r)

def  __contains__( self,  value):
return  self.contains(value)

def  keys( self):
  '''Return a list of the keys used in this bloom filter '''
return [ self.context.keys[i]  for i  in  range( self.context.num_keys)]

       ÔÉúpyreBloom·½·¨:

cdef  class  pyreBloom(object):

      cdef bloom.pyrebloomctxt context
      cdef bytes

      property bits:

      property hashes:
        // Ê¹ÓÃµÄhash·½·¨Êý

      def  delete(self):
        // É¾³ý£¬»áÔÚredisÖÐÉ¾³ý

      def  put(self, value):
        // Ìí¼Ó µ×²ã·½·¨, ²»½¨ÒéÖ±½Óµ÷ÓÃ

      def add(self, value):
        // Ìí¼Óµ¥¸öÔªËØ£¬µ÷ÓÃput·½·¨

      def extend(self, values):
        // Ìí¼ÓÒ»×éÔªËØ£¬µ÷ÓÃput·½·¨

      def contains(self, value):
        // ¼ì²éÊÇ·ñ´æÔÚ£¬µ±`value`¿ÉÒÔµü´úÊ±£¬·µ»Ø`[value]`, ·ñÔò·µ»Ø`bool`

      def keys(self):
        // ÔÚredisÖÐ´æ´¢µÄkeyÁÐ±í

ÓÉÓÚpyreBloomÊ¹ÓÃhiredis¿â£¬±¾ÉíÃ»ÓÐÖØÁ¬µÈÂß¼£¬ÓÚÊÇ×öÁË¼òµ¥µÄ·â×°¡£

             # coding=utf-8
       '''
       bloom filter »ù´¡Ä£¿é

       ¿ÉÓÃ·½·¨:
       extend, keys, contains, add, put, hashes, bits, delete

       Ê¹ÓÃ·½·¨:
        >>> class TestModel(BaseModel):
        ...     PREFIX = "bf:test"
        >>> t = TestModel()
        >>> t.add('hello')
       1
        >>> t.extend(['hi', 'world'])
       2
        >>> t.contains('hi')
       True
        >>> t.delete()
        '''
       import logging
       from six  import  PY3  as  IS_PY3
       from pyreBloom  import pyreBloom, pyreBloomException

       from BloomFilter.utils  import force_utf8

           class  BaseModel( object):
             '''
             bloom filter »ù´¡Ä£¿é
             ²ÎÊý£º
                   SLOT: ¿ÉÓÃ·½·¨ÀàÐÍ
                   PREFIX: redisÇ°×º
                   BF_SIZE: ´æ´¢×î´óÖµ
                   BF_ERROR: ÔÊÐíµÄ³ö´íÂÊ
                   RETRIES: Á¬½ÓÖØÊÔ´ÎÊý
                   host: redis ·þÎñÆ÷IP
                   port: redis ·þÎñÆ÷¶Ë¿Ú
                   db: redis ·þÎñÆ÷DB
                   _bf_conn: ÄÚ²¿±£´æ`pyreBloom`ÊµÀý
              '''
             SLOT  = {  'add ',   'contains ',   'extend ',   'keys ',   'put ',   'delete ',
                          'bits ',   'hashes '}
             PREFIX  =   " "
             BF_SIZE  =  100000
             BF_ERROR  =  0.01
             RETRIES  =  2

             def  __init__( self,  redis = None):
                   '''
                   ³õÊ¼»¯redisÅäÖÃ
                   :param redis: redis ÅäÖÃ
                    '''
                    # ÕâÀï³õÊ¼»¯·ÀÖ¹Àà¾²Ì¬±äÁ¿¶à¸ö¼Ì³ÐÀà¸´ÓÃ£¬µ¼ÖÂÊý¾Ý±»ÎÛÈ¾
                   self._bf_conn  =  None

                   self._conf  = {
                          'host ':   '127.0.0.1 ',   'password ':   ' ',
                          'port ':  6379,   'db ':  0
                  }

                   if redis:
                         for k, v  in redis.items():
                               if k  in  self._conf:
                                     self._conf[k]  = redis[k]
                   self._conf  = force_utf8( self._conf)

             @ property
             def  bf_conn( self):
                   '''
                   ³õÊ¼»¯pyreBloom
                    '''
                   if  not  self._bf_conn:
                        prefix  = force_utf8( self. PREFIX)
                        logging.debug(
                                'pyreBloom connect: redis:// %s: %s/ %s, ( %s  %s  %s) ',
                               self._conf[  'host '],  self._conf[  'port '],  self._conf[  'db '],
                              prefix,  self. BF_SIZE,  self. BF_ERROR,
                        )
                         self._bf_conn  = pyreBloom(
                              prefix,  self. BF_SIZE,  self. BF_ERROR,  ** self._conf)
                   return  self._bf_conn

             def  __getattr__( self,  method):
                    '''µ÷ÓÃpyrebloom·½·¨
                   Ã»ÓÐÃ¶¾ÙµÄ·½·¨½«´Ó`pyreBloom`ÖÐ»ñÈ¡
                   :param method:
                   :return: pyreBloom.{method}
                    '''
                    # Ö»Ìá¹©ÄÚ²¿·½·¨
                   if method  not  in  self. SLOT:
                         raise  NotImplementedError()

                    # ²¶»ñ`pyreBloom`µÄÒì³£, ´òÓ¡±ØÒªµÄÈÕÖ¾
                   def  catch_error( * a,  ** kwargs):
                          '''¶à´ÎÖØÊÔ·þÎñ '''
                        args  = force_utf8(a)
                        kwargs  = force_utf8(kwargs)
                         for _  in  range( self. RETRIES):
                               try:
                                    func  =  getattr( self.bf_conn, method)
                                    res  = func( *args,  **kwargs)
                                      # python3 ·µ»ØÖµºÍpython2·µ»ØÖµ²»ÏàÍ¬£¬
                                      # ÊÖ¹¤´¦Àí·µ»ØÀàÐÍ
                                     if method  ==   'contains '  and  IS_PY3:
                                           if  isinstance(res,  list):
                                                 return [i.decode(  'utf8 ')  for i  in res]
                                     return res
                               except pyreBloomException  as error:
                                    logging.warn(
                                            'pyreBloom Error:    %s  %s ', method,  str(error))
                                     self.reconnect()
                                     if _  ==  self. RETRIES:
                                          logging.error(  'pyreBloom Error ')
                                           raise error

                   return catch_error

             def  __contains__( self,  item):
                    '''Ìø×ª__contains__·½·¨
                   :param item: ²éÑ¯ÔªËØÁÐ±í/µ¥¸öÔªËØ
                   :type item: list/basestring
                   :return: /bool
                    '''
                   return  self.contains(item)

             def  reconnect( self):
                   '''
                   ÖØÐÂÁ¬½Óbloom
                   `pyreBloom` Á¬½ÓÊ¹ÓÃc driver£¬Ã»ÓÐÌá¹©timeout²ÎÊý£¬Ê¹ÓÃÁËÄÚÖÃµÄtimeout
                   Í¬Ê±ÎªÁË±£Ö¤·þÎñµÄ¿É¿¿ÐÔ£¬Ôö¼ÓÁË¶à´ÎÖØÊÔ»úÖÆ¡£
                   struct timeval timeout = { 1, 5000 };
                   ctxt->ctxt = redisConnectWithTimeout(host, port, timeout);
                   del self._bf_conn »áµ÷ÓÃ`pyreBloom`ÄÚÖÃµÄCµÄdel·½·¨£¬»á¹Ø±ÕredisÁ¬½Ó
                    '''
                   if  self._bf_conn:
                        logging.debug(  'pyreBloom reconnect ')
                         del  self._bf_conn
                         self._bf_conn  =  None
                        _  =  self.bf_conn

½ø½×£º¼ÆÊý¹ýÂËÆ÷(Counting Filter)

Ìá¹©ÁËÒ»ÖÖÔÚBloomFilterÉÏÊµÏÖÉ¾³ý²Ù×÷µÄ·½·¨£¬¶øÎÞÐèÖØÐÂÖØÐÂ´´½¨¹ýÂËÆ÷¡£ÔÚ¼ÆÊýÂË²¨Æ÷ÖÐ£¬ÕóÁÐÎ»ÖÃ£¨Í°£©´Óµ¥¸öÎ»À©Õ¹ÎªnÎ»¼ÆÊýÆ÷¡£Êµ¼ÊÉÏ£¬³£¹æ²¼Â¡¹ýÂËÆ÷¿ÉÒÔ±»ÊÓÎª¼ÆÊý¹ýÂËÆ÷£¬ÆäÍ°´óÐ¡ÎªÒ»Î»¡£

²åÈë²Ù×÷±»À©Õ¹ÎªµÝÔöÍ°µÄÖµ£¬²¢ÇÒ²éÕÒ²Ù×÷¼ì²éÃ¿¸öËùÐèµÄÍ°ÊÇ·ñÎª·ÇÁã¡£È»ºó£¬É¾³ý²Ù×÷°üÀ¨µÝ¼õÃ¿¸öÍ°µÄÖµ¡£

´æ´¢Í°µÄËãÊõÒç³öÊÇÒ»¸öÎÊÌâ£¬²¢ÇÒ´æ´¢Í°Ó¦¸Ã×ã¹»´óÒÔÊ¹ÕâÖÖÇé¿öºÜÉÙ¼û¡£Èç¹ûÈ·Êµ·¢Éú£¬ÔòÔöÁ¿ºÍ¼õÁ¿²Ù×÷±ØÐë½«´æ´¢ÇøÉèÖÃÎª×î´ó¿ÉÄÜÖµ£¬ÒÔ±ã±£ÁôBloomFilterµÄÊôÐÔ¡£

¼ÆÊýÆ÷µÄ´óÐ¡Í¨³£Îª3»ò4Î»¡£Òò´Ë£¬¼ÆËã²¼Â¡¹ýÂËÆ÷µÄ¿Õ¼ä±È¾²Ì¬²¼Â¡¹ýÂËÆ÷¶à3µ½4±¶¡£Ïà±ÈÖ®ÏÂ£¬ Pagh£¬PaghºÍRao£¨2005£©ÒÔ¼°FanµÈÈËµÄÊý¾Ý½á¹¹¡££¨2014£©Ò²ÔÊÐíÉ¾³ýµ«Ê¹ÓÃ±È¾²Ì¬BloomFilter¸üÉÙµÄ¿Õ¼ä¡£

¼ÆÊý¹ýÂËÆ÷µÄÁíÒ»¸öÎÊÌâÊÇ¿ÉÀ©Õ¹ÐÔÓÐÏÞ¡£ÓÉÓÚÎÞ·¨À©Õ¹¼ÆÊý²¼Â¡¹ýÂËÆ÷±í£¬Òò´Ë±ØÐëÊÂÏÈÖªµÀÒªÍ¬Ê±´æ´¢ÔÚ¹ýÂËÆ÷ÖÐµÄ×î´ó¼üÊý¡£Ò»µ©³¬¹ý±íµÄÉè¼ÆÈÝÁ¿£¬Ëæ×Å²åÈë¸ü¶àÃÜÔ¿£¬Îó±¨ÂÊ½«Ñ¸ËÙÔö³¤¡£

BonomiµÈÈË¡££¨2006£©ÒýÈëÁËÒ»ÖÖ»ùÓÚd-leftÉ¢ÁÐµÄÊý¾Ý½á¹¹£¬ËüÔÚ¹¦ÄÜÉÏÊÇµÈÐ§µÄ£¬µ«Ê¹ÓÃµÄ¿Õ¼ä´óÔ¼ÊÇ¼ÆËãBloomFilterµÄÒ»°ë¡£´ËÊý¾Ý½á¹¹ÖÐ²»»á³öÏÖ¿ÉÉìËõÐÔÎÊÌâ¡£Ò»µ©³¬³öÉè¼ÆÈÝÁ¿£¬¾Í¿ÉÒÔ½«ÃÜÔ¿ÖØÐÂ²åÈëµ½Ë«±¶´óÐ¡µÄÐÂ¹þÏ£±íÖÐ¡£

Putze£¬SandersºÍSingler£¨2007£©µÄ½ÚÊ¡¿Õ¼äµÄ±äÌåÒ²¿ÉÓÃÓÚÍ¨¹ýÖ§³Ö²åÈëºÍÉ¾³ýÀ´ÊµÏÖ¼ÆÊý¹ýÂËÆ÷¡£

Rottenstreich£¬KanizoºÍKeslassy£¨2012£©ÒýÈëÁËÒ»ÖÖ»ùÓÚ±äÁ¿ÔöÁ¿µÄÐÂÍ¨ÓÃ·½·¨£¬¸Ã·½·¨ÏÔ×ÅÌá¸ßÁË¼ÆËã²¼Â¡¹ýÂËÆ÷¼°Æä±äÌåµÄÎó±¨¸ÅÂÊ£¬Í¬Ê±ÈÔÖ§³ÖÉ¾³ý¡£

Óë¼ÆÊý²¼Â¡¹ýÂËÆ÷²»Í¬£¬ÔÚÃ¿¸öÔªËØ²åÈëÊ±£¬É¢ÁÐ¼ÆÊýÆ÷ÒÔÉ¢ÁÐ±äÁ¿ÔöÁ¿¶ø²»ÊÇµ¥Î»ÔöÁ¿µÝÔö¡£Òª²éÑ¯ÔªËØ£¬ÐèÒª¿¼ÂÇ¼ÆÊýÆ÷µÄÈ·ÇÐÖµ£¬¶ø²»½ö½öÊÇËüÃÇµÄÕýÃæÐÔ¡£Èç¹ûÓÉ¼ÆÊýÆ÷Öµ±íÊ¾µÄ×ÜºÍ²»ÄÜÓÉ²éÑ¯ÔªËØµÄÏàÓ¦±äÁ¿ÔöÁ¿×é³É£¬Ôò¿ÉÒÔ½«·ñ¶¨´ð°¸·µ»Ø¸ø²éÑ¯¡£

----------------------------
ÔÎÄÁ´½Ó:https://blog.51cto.com/14455981/2476198

³ÌÐòÔ³µÄ¼¼Êõ´ó¹ÛÔ°£ºwww.javathinker.net

[Õâ¸öÌù×Ó×îºóÓÉ admin ÔÚ 2020-03-14 13:27:30 ÖØÐÂ±à¼]

Java¾«Æ·Êé¼®ÍÆ¼ö

Java×îÐÂÊÓÆµ½Ì³ÌÍÆ¼ö

JavaÃæÏò¶ÔÏó±à³Ì-->Í¼ÐÎÓÃ»§½çÃæ£¨ÉÏ£©

JavaWeb¿ª·¢-->JSPÖÐÊ¹ÓÃJavaBean(¢ñ)

JSPÓëHibernate¿ª·¢-->Ó³Éä¶ÔÏó±êÊ¶·û

JavaÍøÂç±à³Ì-->¿Í»§¶ËÐÒé´¦Àí¿ò¼Ü

¾«Í¨Spring-->Í¨¹ýAxios·ÃÎÊ·þÎñÆ÷

Vue3¿ª·¢-->´´½¨×ÛºÏ¹ºÎïÍøÕ¾Ó¦ÓÃ

±¾Õ¾ÆäËûÏà¹ØÎÄÕÂ

Ò»ÌõÀ¬»øSQL£¬°Ñ 64 ºË CPU ¿ìÅÜ±ÀÁË£¡

MySQLÈ«ÃæÓÅ»¯ÊµÕ½×Ü½á£¡

ÉñÆæµÄ SQL Ö® WHERE Ìõ¼þµÄÌáÈ¡ÓëÓ¦ÓÃ

Ã»ÓÐ¹¬Í¢ÄÚ¶·£¬Êý¾Ý¿â½çµÄÑÓìû¹¥ÂÔ

MySQL É¾³ýÊý¾Ý±í

MySQL É¾³ýÊý¾Ý¿â

SQL AVG() º¯ÊýµÄÓÃ·¨

SQL CREATE VIEW¡¢REPLACE VIEW¡¢ DROP VIEW Óï¾ä

SQL ALTER TABLE Óï¾ä

XMLµÄDTD¶¨Òå

ÍøÂçÔËÎ¬ - ÄãÓëÕæÏà¾Í²îÒ»²ã´°»§Ö½

º£Á¿ÈÕÖ¾·ÖÎöÓëÖÇÄÜÔËÎ¬

µçÄÔÆô¶¯²»ÆðÀ´,ÌáÊ¾Reboot and select proper boot device ...

Java ²Ù×÷ÏµÍ³Æª

¸ü¶à...

IP: ÒÑÉèÖÃ±£ÃÜ

Ê÷ÐÎÁÐ±í:

¹²1Ò³ 0Ìõ¼ÇÂ¼ µ±Ç°µÚ1Ò³

ÖÐÎÄ°æÈ¨ËùÓÐ£º JavaThinker¼¼ÊõÍøÕ¾ Copyright 2016-2026 »¦ICP±¸16029593ºÅ-2
ÜöÝÍJava³ÌÐòÔ±ÖÇ»ÛµÄ½á¾§£¬·ÖÏí½»Á÷JavaÇ°ÑØ¼¼Êõ¡£ ÁªÏµÎÒÃÇ
ÈçÓÐ¼¼ÊõÎÄÕÂÉæ¼°ÇÖÈ¨£¬ÇëÓë±¾Õ¾¹ÜÀíÔ±ÁªÏµ¡£