[oeasy]python0018_ ASCII_字符分布_数字_大小写字母_符号_黑暗森林

简介: [oeasy]python0018_ ASCII_字符分布_数字_大小写字母_符号_黑暗森林

 

打包和解包

回忆上次内容

    • decode

     

      • 就是解码
        • 解码和编码可以转化
          • encode 编码
          • decode 解码
          • 互为逆过程
            • 大小写字母之间序号全都相差(32)10进制

            image.gif编辑

              • 这是为什么呢?🤔

              差距

                • 大写字母和小写字母
                  • 总是相差(32)10进制

                  image.gif编辑

                    • 从10进制角度看不清楚
                    • 我们从16进制的角度看看

                    16进制

                      • 正好是(0x20)16进制

                      image.gif编辑

                        • 为什么不多不少
                          • 就差 0x20 呢?
                          • 怎么那么寸呢?🤔
                            • 转化为2进制之后
                              • 恰好是1位(bit)
                                • 这是偶然的吗?

                                ASCII 码表趣事

                                  • 其实最初相差的并不是 0x20
                                    • 之前 ibm 的 EBCDIC 编码也是这样的

                                    正在上传…重新上传取消

                                      • 也相差一个2进制位

                                      image.gif编辑

                                        • EBCDIC问题是字母不连续
                                          • i、j之间不直接相连
                                            • EBCDIC最终被ascii所淘汰

                                            ASCII

                                              • ASCII字母是连续的
                                                • 而且大小写字母间
                                                • 相差正好是 1个 二进制位
                                                • 对应 b6 这个位
                                                  • 那为什么要差 1个 二进制位 呢?

                                                  image.gif编辑

                                                    • 有了这种对应关系之后
                                                      • 做大小写不敏感的字符串查找就快多了
                                                      • 这个 0x20 发生在 1963 年 5 月
                                                        • The X3.2.4 task group voted its approval for the change to ASCII at its May 1963 meeting.
                                                        • Locating the lowercase letters in columns 6 and 7 caused the characters to differ in bit pattern from the upper case by a single bit, which simplified case-insensitive character matching and the construction of keyboards and printers.
                                                          • 当时的目的是
                                                            • 降低大小写不敏感字符串匹配的难度
                                                            • 降低打字机键盘的构造成本
                                                              • 如果搜索中遇到的是小写字母
                                                                • 修改1位之后
                                                                  • 小写就都变成大写
                                                                  • 不用查找对应关系表匹配
                                                                    • 然后再观察全大写的情况下是否匹配
                                                                      • 这就是大小写字母的情况
                                                                        • 0x41-0x5A这个范围是大写字母
                                                                        • 0x61-0x7A这个范围是小写字母
                                                                          • 除了大小写字母之外
                                                                            • 数字字符又是如何表示的呢?

                                                                            ASCII 码表范围

                                                                            image.gif编辑

                                                                              • 0x30-0x39这个范围是数字
                                                                                • 数字的编码减去0x30正好得到数字本身
                                                                                • 后四位刚好是BCD编码模式
                                                                                  • Binary-Coded Decimal

                                                                                  image.gif编辑

                                                                                    • 我们再来看看 ASCII 除了字母和数字还有什么?

                                                                                    各种符号

                                                                                      • 各种符号是不连续的

                                                                                      image.gif编辑

                                                                                        • 穿插在数字、字母周围
                                                                                          • sp 其实就是space(空格)
                                                                                            • 表格最左边是什么呢?

                                                                                            ASCII

                                                                                              • 0x20-0x7F 之间有各种真实字符

                                                                                              image.gif编辑

                                                                                                • 0x00-0x1F 之间的东西是什么?
                                                                                                  • 前两列都是对应多个字符的
                                                                                                    • 具体含义目前还不知道
                                                                                                      • ASCII中的字符本来英语里就有
                                                                                                        • 但是字符是英文字符、数字和标点
                                                                                                          • 怎么编码的呢?

                                                                                                          ASCII由来

                                                                                                            • ASCII码是由电报代码发展而来的

                                                                                                            正在上传…重新上传取消

                                                                                                              • 由贝尔数据服务公司推广

                                                                                                              image.gif编辑

                                                                                                                • 电报码不是摩斯电码吗?

                                                                                                                摩斯电码

                                                                                                                  • 更早之前确实是摩斯电码
                                                                                                                  • 下图是他的编码表
                                                                                                                    • 分成长和短两种信号,就是嘀和嗒

                                                                                                                    image.gif编辑

                                                                                                                        • 欢迎您有机会来看看oeasy电学、科学史那几个系列
                                                                                                                          • 还记得encode/decode中的code么?
                                                                                                                            • 曾经一度指的就是各种电报编码汇编
                                                                                                                            • 后来统一到摩斯电码

                                                                                                                            摩斯电码通信规则

                                                                                                                              • 下图是他的通信规则
                                                                                                                                • 三个断确认本字符结束了
                                                                                                                                • 三个断就是字符之间的分隔符
                                                                                                                                • 录入状态并不是 0、1 两种状态
                                                                                                                                • 而是长、短、暂停三种状态

                                                                                                                                image.gif编辑

                                                                                                                                  • 编码的原则是什么呢?

                                                                                                                                  效率问题

                                                                                                                                    • 编码的规则是常用的字符点击次数少
                                                                                                                                      • 按照字符出现概率分配对应点击数量
                                                                                                                                        • TE 出现频率最高
                                                                                                                                        • 所以用一次点击电键的数量
                                                                                                                                          • 本质上是一棵霍夫曼树

                                                                                                                                          image.gif编辑

                                                                                                                                            • 当时发射和接收全靠人
                                                                                                                                              • 什么叫长、什么叫短、什么叫断
                                                                                                                                                • 发送者控制发报速度
                                                                                                                                                  • 接收者跟着这个发报速度
                                                                                                                                                  • 现查表是来不及的
                                                                                                                                                  • 需要熟悉
                                                                                                                                                    • 摩斯电码码表
                                                                                                                                                    • 常用缩写
                                                                                                                                                      • 这摩斯电码是3进制的编码方式
                                                                                                                                                      • 怎么变成ascii这种0101的二进制编码的呢?

                                                                                                                                                      总结

                                                                                                                                                        • ASCII 由这样几类字符构成
                                                                                                                                                          • 英文大写字符
                                                                                                                                                          • 英文小写字符
                                                                                                                                                          • 数字
                                                                                                                                                          • 符号
                                                                                                                                                            • 电报时代对于英文、数字的编码
                                                                                                                                                              • 使用的是摩斯电码

                                                                                                                                                              image.gif编辑

                                                                                                                                                                • 这摩斯电码是3进制的编码方式
                                                                                                                                                                  • 长短空
                                                                                                                                                                    相关文章
                                                                                                                                                                    |
                                                                                                                                                                    算法 前端开发 数据处理
                                                                                                                                                                    小白学python-深入解析一位字符判定算法
                                                                                                                                                                    小白学python-深入解析一位字符判定算法
                                                                                                                                                                    175 0
                                                                                                                                                                    |
                                                                                                                                                                    5月前
                                                                                                                                                                    |
                                                                                                                                                                    存储 数据可视化 BI
                                                                                                                                                                    Python可视化应用——学生成绩分布柱状图展示
                                                                                                                                                                    本程序使用Python读取Excel中的学生成绩数据,统计各分数段人数,并通过Matplotlib库绘制柱状图展示成绩分布。同时计算最高分、最低分及平均分,实现成绩可视化分析。
                                                                                                                                                                    409 0
                                                                                                                                                                    |
                                                                                                                                                                    开发工具 Python
                                                                                                                                                                    [oeasy]python043_自己制作的ascii码表_循环语句_条件语句_缩进_indent
                                                                                                                                                                    本文介绍了如何使用Python制作ASCII码表,回顾了上一次课程中`print`函数的`end`参数,并通过循环和条件语句实现每8个字符换行的功能。通过调整代码中的缩进,实现了正确的输出格式。最后展示了制作完成的ASCII码表,并预告了下一次课程的内容。
                                                                                                                                                                    161 2
                                                                                                                                                                    |
                                                                                                                                                                    人工智能 Shell 开发工具
                                                                                                                                                                    [oeasy]python0041_输出ASCII码表_英文字符编码_键盘字符_ISO_646
                                                                                                                                                                    本文介绍了ASCII码表的生成与使用,包括英文字符、数字和符号的编码。通过Python代码遍历0到127的ASCII值,解决了找不到竖线符号的问题,并解释了ASCII码的固定映射关系及其重要性。文章还介绍了ASCII码的历史背景,以及它如何成为国际标准ISO 646。最后,通过安装`ascii`程序展示了完整的ASCII码表。
                                                                                                                                                                    202 1
                                                                                                                                                                    |
                                                                                                                                                                    存储 Python
                                                                                                                                                                    [oeasy]python038_ range函数_大小写字母的起止范围_start_stop
                                                                                                                                                                    本文介绍了Python中`range`函数的使用方法及其在生成大小写字母序号范围时的应用。通过示例展示了如何利用`range`和`for`循环输出指定范围内的数字,重点讲解了小写和大写字母对应的ASCII码值范围,并解释了`range`函数的参数(start, stop)以及为何不包括stop值的原因。最后,文章留下了关于为何`range`不包含stop值的问题,留待下一次讨论。
                                                                                                                                                                    232 4
                                                                                                                                                                    |
                                                                                                                                                                    iOS开发 MacOS Python
                                                                                                                                                                    Python编程-macOS系统数学符号快捷键录入并生成csv文件转换为excel文件
                                                                                                                                                                    Python编程-macOS系统数学符号快捷键录入并生成csv文件转换为excel文件
                                                                                                                                                                    140 1
                                                                                                                                                                    |
                                                                                                                                                                    索引 Python
                                                                                                                                                                    python之判断字符里面有没有|8
                                                                                                                                                                    python之判断字符里面有没有|8
                                                                                                                                                                    |
                                                                                                                                                                    人工智能 开发工具 Python
                                                                                                                                                                    [oeasy]python040_缩进几个字符好_输出所有键盘字符_循环遍历_indent
                                                                                                                                                                    本文探讨了Python代码中的缩进问题。通过研究`range`函数和`for`循环,发现缩进对于代码块的执行至关重要。如果缩进不正确,程序会抛出`IndentationError`。文章还介绍了Python的PEP8规范,推荐使用4个空格进行缩进,并通过示例展示了如何使用Tab键实现标准缩进。最后,通过修改代码,输出了从0到122的字符及其对应的ASCII码值,但未能找到竖线符号(`|`)。文章在总结中提到,下次将继续探讨竖线符号的位置。
                                                                                                                                                                    161 0
                                                                                                                                                                    6-18|Python画字母H
                                                                                                                                                                    6-18|Python画字母H
                                                                                                                                                                    |
                                                                                                                                                                    3月前
                                                                                                                                                                    |
                                                                                                                                                                    数据采集 机器学习/深度学习 人工智能
                                                                                                                                                                    Python:现代编程的首选语言
                                                                                                                                                                    Python:现代编程的首选语言
                                                                                                                                                                    312 102

                                                                                                                                                                    推荐镜像

                                                                                                                                                                    更多