短链平台设计

简介: 一种生产环境可用的短链生成方法,将长度较长、难以识别的长链转换成长度可控的短链,点击短链再跳转回长链的方法

为什么需要短链?
有时候,平台的地址会异常的长,比如一次搜索的地址:

https://www.google.com/search?q=mongodb&sca_esv=567212709&ei=OxAMZdm7PM7ZhwO0wK0w&ved=0ahUKEwiZxd2VtbuBAxXO7GEKHTRgCwYQ4dUDCBA&uact=5&oq=mongodb&gs_lp=Egxnd3Mtd2l6LXNlcnAiB21vbmdvZGIyBxAAGIoFGEMyBxAAGIoFGEMyBxAAGIoFGEMyDRAAGIoFGLEDGIMBGEMyBxAAGIoFGEMyBxAAGIoFGEMyBxAAGIoFGEMyBxAAGIoFGEMyBxAAGIoFGEMyBxAAGIoFGENI6QRQowJYowJwAXgBkAEAmAGKAaABigGqAQMwLjG4AQPIAQD4AQHCAgoQABhHGNYEGLAD4gMEGAAgQYgGAZAGCQ&sclient=gws-wiz-serp

如果这个地址仅仅在网站内部,不需要用户操作是自动生成和跳转的,那也没有把它缩短的必要。但是如果我想把这个地址分享到外部平台或者发送给别人,那使用这种地址就很痛苦了。由此,我们需要设计一个系统,能够把这么长的地址,转换成一个相对较短的地址。并且当用户点击短链时,还能回到原来长链对应的内容。
此外,使用短链的好处还有:

  • 内容变短后,在对内容长度有限制的平台,可编辑文字变多。比如微博限制140个字符,如果我写上这么长的一个地址,那几乎没有多少自己可以编辑的内容了;再比如,发送短信的场景,如果是这么长的链接,再加上需要发送的其它内容,可能就得拆分成几条短信发送,成本也变高了。
  • 容易识别:有些平台,比如有些IM平台,会自动解析网址,显示网站内容。这么长的链接,IM在识别的时候,可能因为长度太长,内容复杂而识别不全,无法显示网站内容;即便是使用二维码,过多的内容也会导致二维码密集难以识别。

    生成短链的方法

    唯一ID转换进制法

    这种方法的流程是,先根据长链内容,生成一个全局唯一的ID,然后将这个数字ID转换成用62进制表示,得到一个短码。保存短码和长链的对应关系,后续就可以根据短码获得真实的长链
    之所以是62进制,是因为26个大写字母+26个小写字母+10位数字。
    我们可以在本地维护一个62位元素的数组,例如:

    char[] chars ={'A', 'B', 'C', 'D', 'E', 'F', 
                  'G', 'H', 'I', 'J', 'K', 'L', 
                  'M', 'N', 'O', 'P', 'Q', 'R', 
                  'S', 'T', 'U', 'V', 'W', 'X', 
                  'Y', 'Z', 'a', 'b', 'c', 'd', 
                  'e', 'f', 'g', 'h', 'i', 'j', 
                  'k', 'l', 'm', 'n', 'o', 'p', 
                  'q', 'r', 's', 't', 'u', 'v', 
                  'w', 'x', 'y', 'z', '0', '1', 
                  '2', '3', '4', '5', '6', '7', 
                  '8', '9'};
    

    然后将唯一ID,转成62进制,方法如下:

    StringBuilder sb = new StringBuilder();
    while (id > 0) {
         
      sb.append(chars[(int) (id % chars.length)]);
      id = id / chars.length;
    }
    System.out.println(sb.reverse());
    

    测试一下:

    // 假设得到的唯一ID是 987654321 ,那么转换得到的短码是
    BE0GAZ
    // 假设得到的唯一ID是 987654322 ,那么转换得到的短码是
    BE0GAa
    

    优化

    1、编码表顺序打乱
    如果编码表完全按照字母顺序,那么有心之人只要连续生成两个短链,就知道短链生成的规则了,进而可以获得一些隐秘信息。
    实际使用中,可以将编码表顺序打乱,不完全按照字母顺序来,即便是连续生成几个短链,也难以猜到编码表规则
    2、保留一位字母
    如果编码表完全是26个大写字母+26个小写字母+10位数字,那么根据唯一ID生成短码的时候,就会出现短码长度不一致的情况,比如

    // id = 100 短码是Bm
    // id = 987654321 短码是BE0GAZ
    

    为了保持所有生成的短码长度一致,可以预留一位字母,当生成的短码长度不够时,填充默认的字母
    关于短码的长度,可以预估一下短链的数量。采用61进制时,6位短码就可以支持五百多亿的短链了
    3、检查是否重复
    如果生成唯一ID的策略不能保证一定全局唯一,最好还是加上一个重复检查
    关于重复检查的方法,推荐使用布隆过滤器。布隆过滤器是一种高效的、内存占用非常小的“检查是否存在”的数据结构。redis、guava等组件都有相应的实现

    短链跳转的原理

    当短链生成后,用户点击短链时,是如何跳转到真实的地址呢?
    浏览器会失败HTTP请求返回的不同code,当服务端返回301和302时,浏览器都会跳转到新的地址。区别是

  • 301,代表永久重定向,当浏览器第一次拿到短链对应的长链后,后续再次访问短链,浏览器会直接访问长链,不再和服务端进行交互。一般不会采用这种方式,因为服务端可能需要对长链进行一些调整和统计分析的工作

  • 302,代表临时重定向,每次访问短链,浏览器都会先去访问服务端,拿到长链后再跳转到长链地址,推荐使用的方式

服务端实现重定向的方式,只需要在controller中返回:

HttpHeaders headers = new HttpHeaders();
headers.setLocation(new URI("长链内容"));
return new ResponseEntity<>(headers, HttpStatus.FOUND);
目录
相关文章
|
SQL 缓存 NoSQL
高性能短链设计
高性能短链设计
|
8月前
|
搜索推荐 数据管理 数据挖掘
解码2024年项目管理系统:排行榜背后的功能与特色解析
2024年十大项目管理工具:Zoho Projects以其专业成熟度领先,适合跨部门协作和进度跟踪;Nifty适合初创公司,界面直观,响应快速;Quickbase面向处理大量信息的团队,提供定制化解决方案;WorkOtter专为中大型企业资源管理和汇报设计;Asana适合大型协作团队,任务管理和沟通高效;Monday.com高度可定制,适合复杂项目管理;Smartsheet结合电子表格功能,适合流程多变的团队;Adobe Workfront针对复杂项目和自动化需求;ClickUp是一站式工作平台,功能多样;Trello则以简洁看板适合小团队和个人。考虑团队规模、项目复杂度和个性化需求来选工具
87 1
|
8月前
|
小程序 IDE 定位技术
【社区每周】小程序支持预拉取地理位置;验收工具组件集成至“商家券”等产品文档(11月第五期)
【社区每周】小程序支持预拉取地理位置;验收工具组件集成至“商家券”等产品文档(11月第五期)
97 11
|
8月前
|
小程序 开发者
【社区每周】小程序商品能力两项接口变动(11月第三期)
【社区每周】小程序商品能力两项接口变动(11月第三期)
80 10
|
8月前
|
Web App开发 存储 自然语言处理
推荐一款价值几万元的免费开源GPTs导航!还可自定义数据源做成通用导航站!
推荐一款价值几万元的免费开源GPTs导航!还可自定义数据源做成通用导航站!
153 0
|
8月前
|
自然语言处理 安全 AndFix
区块链商城系统开发步骤指南/详细需求/源码功能/多语言/海外版
When developing a blockchain mall system, the following steps and requirements are usually required:
|
安全 Python
盲盒商城系统模型开发技术方案源代码详情
blind_boxes = get_blind_boxes() return render_template(&#39;index.html&#39;, blind_boxes=blind_boxes) else: return redirect(url_for(&#39;login&#39;))
|
存储 供应链 前端开发
开源SaaS进销存系统如何实现无限开商户?
管店云开源进销存是一款功能完善、易于扩展的SaaS进销存系统。它涵盖了商品管理、销售开单、库存管理、客户管理等多个模块,满足了中小型商户在企业进销存管理方面的需求。管店云开源进销存还具有良好的用户体验,用户通过网页登录和手机APP端即可随时随地管理销售单、进货、库存和客户关系。
172 0
|
数据挖掘 网络架构
短链系统设计-服务设计
该系统其实很简单,只需要有一个 service即可:URL Service。由于 tiny url只有一个 UrlService: 本身其实就是个小的独立应用 也无需关心其他任何业务功能
177 0
短链系统设计-服务设计
|
算法 机器人 区块链
数字货币量化机器人系统开发(项目案例)/功能说明/逻辑方案/源码平台
  简单地说,量化交易机器人就是能够自动执行交易策略的交易软件。它借助于计算机技术和数学模型,对市场行情进行分析预测,并根据程序设定的规则和条件自动执行交易策略,完成交易操作。Compared with traditional manual trading,quantitative trading robots have faster trading speed,lower transaction costs,and higher trading efficiency.

热门文章

最新文章