布隆过滤器 redis

news/2024/7/23 16:24:57 标签: redis, java, 数据库

一.为什么要用到布隆过滤器?

缓存穿透:查询一条不存在的数据,缓存中没有,则每次请求都打到数据库中,导致数据库瞬时请求压力过大,多见于爬虫恶性攻击

因为布隆过滤器是二进制的数组,如果使用了它,可以把需要的对应的全量业务数据的key值全放到布隆过滤器中,内存占用较小,这样就不会击穿数据库

二.数据访问流程

布隆过滤器–>redis缓存–>数据库
1. 布隆过滤器如果不存在,直接返回,不访问缓存和<a class=数据库 2. 布隆过滤器有,如果缓存有,直接返回数据 3. 布隆过滤器有,如果缓没有,查数据库" />

三.原理:

在这里插入图片描述

使用二进制数组,对要存入的key进行多次hash,分配到数组的不同位置,数组的值从0改成1,查询的时候也进行多次hash,命中到数组的位置的值都是1则key可能存在,如果有一个不是1则key一定不存在
在这里插入图片描述

四.缺点

缺点1:

存在误判的情况,比如:hello和你好经过hash后的值一样,出现hash冲突。比如“你好”是存在,“hello”不存在,但他们的hash值一样,就会通过
在这里插入图片描述
解决:

1.根据数据量大小设置误判率。误判率越小,使用的hash函数越多,hash冲突越小,但计算的时间增加,内存占用更多
2.增大布隆过滤器数组

缺点2:

删除困难: 布隆过滤器无法直接删除已添加的元素,因为删除操作会影响其他元素的判断结果。在删除元素时,可能会导致一些位置的位被置为 0,从而影响其他元素的判断结果,增加误判的概率

解决:

只能是重新载入布隆过滤器了。开发定时任务,每隔几个小时,自动创建一个新的布隆过滤器数组替换老的。注意,是几小时,这也就意味着,这一方法在高并发的情况下有巨大缺点

五.代码实践

        <dependency>
            <groupId>org.redisson</groupId>
            <artifactId>redisson-spring-boot-starter</artifactId>
            <version>3.27.2</version>
        </dependency>
java">import org.redisson.Redisson;
import org.redisson.api.RBloomFilter;
import org.redisson.api.RedissonClient;
import org.redisson.config.Config;
import org.springframework.beans.factory.annotation.Value;
import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;

/**
 * redisson客户端使用Bloom过滤器拦截无效请求,解决缓存穿透
 * 项目初始化的时候初始化布隆过滤器(例如把商品编号都放进去),
 * 用户发过来的请求(带商品编号)先经过布隆过滤器过滤,过滤掉的返回null
 *
 */
@Configuration
public class RedissinConfig {


   @Value("${redisson.address}")
   private String addressUrl;


    @Value("${redisson.password}")
    private String password;


    @Bean
    public RedissonClient redissonClient() {
    Config config = new Config();
    config.useSingleServer()
    .setAddress(addressUrl)
    .setRetryInterval(5000)
    .setTimeout(10000)
    .setDatabase(0)
    .setPassword(password)
    .setConnectTimeout(10000);
    return Redisson.create(config);
    }

    /**
     * 可以不注册成bean,直接使用redissonClient来创建Bloom过滤器
     * @param redissonClient
     * @return
     */
   @Bean
   public RBloomFilter<String> bloomFilter(RedissonClient redissonClient) {
      RBloomFilter<String> bloomFilter = redissonClient.getBloomFilter("bloom");
      bloomFilter.tryInit(1000000L, 0.01);
      return bloomFilter;
   }

}
java">import lombok.extern.slf4j.Slf4j;
import org.junit.Before;
import org.junit.Test;
import org.junit.runner.RunWith;
import org.redisson.api.RBloomFilter;
import org.redisson.api.RedissonClient;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.boot.test.context.SpringBootTest;
import org.springframework.test.context.junit4.SpringRunner;

@RunWith(SpringRunner.class)
@SpringBootTest(classes = DataApplication.class)
@Slf4j
public class BloomTest {

    @Autowired
    private RedissonClient redissonClient;

    RBloomFilter<String> bloomFilter;

    @Before
    public void init()
    {
        bloomFilter = redissonClient.getBloomFilter("bloom");
        bloomFilter.tryInit(10000L, 0.01);
    }

    /**
     * 测试耗时和误判率
     */
    @Test
    public void test()
    {
        long start = System.currentTimeMillis();

        int total=10000;
        for (int i = 0; i < total; i++)
        {
            bloomFilter.add(String.valueOf(i));
        }
        long end= System.currentTimeMillis();
        log.info("插入用时:{}",end-start);
        int count = 0;
        for (int i = total; i < total+1000; i++)
        {
            if(bloomFilter.contains(String.valueOf(i))){
                count++;
                log.info("误判了:{}",i);
            }
        }
        log.info("插入用时:{}",System.currentTimeMillis()-end);
        log.info("count为:{},误判率:{}",count,(count*1.0/1000));
    }

    /**
     * 获取count
     */
    @Test
    public void countBloomTest()
    {

        long count = bloomFilter.count();
        log.info("count为:{}",count);
    }

    /**
     * 删除过滤器
     */
    @Test
    public void delBloomTest()
    {
        bloomFilter.delete();
    }


}

1万的数据插入差不多用了4分钟,查询1000个数据用了24秒
在这里插入图片描述
redis可视化中看到的数据如下
在这里插入图片描述

在这里插入图片描述

六.源码解析

布隆过滤器初始化源码,保存的信息(size,hashIterations,expectedInsertions,falseProbability),跟上图匹配,计算位数组大小和哈希个数是数学计算公式
在这里插入图片描述
在这里插入图片描述

参考:
https://zhuanlan.zhihu.com/p/622044226


http://www.niftyadmin.cn/n/5546667.html

相关文章

通过高德地图 JS API实现单击鼠标进行标注

效果图: 核心代码: <template><a-modal title="选择地图所在位置" :width="width" :visible="visible" @ok="handleOk" @cancel="handleCancel" cancelText="关闭"><div class="location-…

5G(NR) NTN 卫星组网架构

5G(NR) NTN 卫星组网架构 参考 3GPP TR 38.821 5G NTN 技术适用于高轨、低轨等多种星座部署场景&#xff0c;是实现星地网络融合发展的可行技术路线。5G NTN 网络分为用户段、空间段和地面段三部分。其中用户段由各种用户终端组成&#xff0c;包括手持、便携站、嵌入式终端、车…

elasticsearch SQL:在Elasticsearch中启用和使用SQL功能

❃博主首页 &#xff1a; 「码到三十五」 &#xff0c;同名公众号 :「码到三十五」&#xff0c;wx号 : 「liwu0213」 ☠博主专栏 &#xff1a; <mysql高手> <elasticsearch高手> <源码解读> <java核心> <面试攻关> ♝博主的话 &#xff1a…

软件工程常见知识点

下午收到字节日常实习的面试邀请&#xff0c;希望这次能有一个好的表现。言归正传&#xff0c;邮件中提到这些问题&#xff0c;我这边借了书并查了网上的资料&#xff0c;做一个提前准备。 软件工程核心概念&#xff1a; 如何从一个需求落实到一个系统设计&#xff1f; 经过我…

一文洞悉巴基斯坦电子游戏出海引流获客广告风口不容忽视

一文洞悉巴基斯坦电子游戏出海引流获客广告风口不容忽视 随着全球数字经济的蓬勃发展&#xff0c;电子游戏行业也迎来了前所未有的机遇。巴基斯坦&#xff0c;这个拥有庞大人口基数和日益增长的消费能力的国家&#xff0c;其电子游戏市场潜力巨大。本文旨在探讨巴基斯坦电子游戏…

InetAddress.getLocalHost().getHostAddress()阻塞导致整个微服务崩溃

InetAddress.getLocalHost().getHostAddress()阻塞导致整个微服务崩溃 import java.net.InetAddress;public class GetHostIp {public static void main(String[] args) {try {long start System.currentTimeMillis();String ipAddress InetAddress.getLocalHost().getHostA…

JRE、JVM、JDK分别是什么。

JDK JDK的英文全称是Java Development Kit。JDK是用于制作程序和Java应用程序的软件开发环境。JDK 是 Java 开发工具包&#xff0c;它是 Java 开发者用来编写、编译、调试和运行 Java 程序的集合。JDK 包括了 Java 编译器&#xff08;javac&#xff09;、Java 运行时环境&…

CUDA Kernel调试与优化--背景知识扫盲(LLM生成)

CUDA Kernel调试与优化–背景知识扫盲(LLM生成) 对于使用CUDA进行调试与性能优化&#xff0c;官方提供了丰富的参考资料和工具。以下是一些关键资源&#xff0c;可以帮助你更好地调试和优化CUDA代码&#xff1a; 官方文档和指南 CUDA Toolkit Documentation URL: CUDA Toolk…