[oeasy]python0122_日韩字符_日文假名_JIS_Shift_韩国谚文

简介: [oeasy]python0122_日韩字符_日文假名_JIS_Shift_韩国谚文

日文假名和韩国谚文 回忆上次内容

  • 上次回顾了非ascii的拉丁字符编码的进化过程
  • 0-127 是 ascii 的领域


  • 世界各地编码分布
  • 拉丁字符扩展 ascii 共 16 种
  • 由iso组织制定
  • 从iso-8859-1
  • 到iso-8859-16


  • 无法同时显示俄文和法文



  • 此时中日韩的文字也需要进入计算机
  • 象形文字的字符集超级巨大
  • 日本、韩国也用汉字
  • 数量2万起步


添加图片注释,不超过 140 字(可选)

  • 真能把 如此巨大的字符集
  • 编码进入计算机吗?🤔


文字

  • 日本汉字我们可以直接看懂

添加图片注释,不超过 140 字(可选)

  • 地铁里的 标记

添加图片注释,不超过 140 字(可选)

  • 日文中 为什么
  • 这么多汉字呢?


遣唐使

  • 皇子公卿僧侣
  • 都要 专门
  • 来中国 朝圣
  • 学文化


添加图片注释,不超过 140 字(可选)

  • 日文 很多词
  • 都 能看懂
  • 管 老师 叫做 先生
  • 管 火车 叫做 机车
  • 管 学习 叫做 勉强
  • 管 辣 叫 辛


添加图片注释,不超过 140 字(可选)

  • 特别辣
  • 叫 激辛


  • 这些汉字怎么来的呢?

空海和尚

  • 从日本来的 留学僧
  • 不但学习 汉语佛法
  • 也学习 汉字书法


添加图片注释,不超过 140 字(可选)

  • 并把这些文化带回日本
  • 汉字 成为 书写符号
  • 口头系统的 日语
  • 可以 记录下来了



  • 正如同
  • 使用圣书体的一些字型
  • 将腓尼基的口语记录下来



万叶集

  • “叶” 是 “世”
  • 即时代
  • 希望能流传到万世


  • 各种各样的歌
  • 敬畏自然山神、河神 的歌
  • 男女恋爱 的歌
  • 挽歌


添加图片注释,不超过 140 字(可选)

  • 汉字
  • 数量很多
  • 记起来、写起来也比较复杂
  • 只有 最有文化的人
  • 才能 都写下来



  • 自己 写东西 的时候
  • 有些字 忘了 怎么写
  • 就拿一个 同音字
  • 来 假借



日语假名

  • 假借的 次数 多了
  • 就 固定了下来


  • 形成了
  • 专门的 日语拼音 字符


添加图片注释,不超过 140 字(可选)

  • 假名
  • 存在着多个体系
  • 不同的时代
  • 不同的地域



平假名

  • 直到明治33年
  • 发行公文才得以统一


  • 万葉仮名(假名)
  • 草书风格的符号
  • 有女性的柔美
  • 抄文众多
  • 《枕草子》
  • 《源氏物语》



添加图片注释,不超过 140 字(可选)

  • 把写法也固定了下来
  • 成为铅字


  • 万葉仮名(假名)
  • 形成了
  • 现代假名系统 中的 平假名



  • 除了平假名之外
  • 还有片假名


片假名

  • 片假名来自 汉字 的 一片
  • 也是一种 假名系统
  • 有 硬朗的 楷书 转化而来


添加图片注释,不超过 140 字(可选)

  • 明治维新时期
  • 大量欧美外来语涌入日本
  • 日语只取其读音
  • 用片假名将其表示出来


  • 假名系统
  • 是 拼音文字 系统
  • 字符数量 不多


最初的日文编码

  • 在ascii的基础上
  • 把片假名加了上去


添加图片注释,不超过 140 字(可选)

  • 字型什么样呢?

假名字形码

添加图片注释,不超过 140 字(可选)

  • 可以把这些片假名输出出来吗?

输出假名

  • 下面的代码是将a1到e0
  • 封包进入一个字节
  • 然后再将字节解码



添加图片注释,不超过 140 字(可选)

  • 可以动手试试
  • 以后我们会详细讲解封包解包


  • 范围[0xa1, 0xe0)

添加图片注释,不超过 140 字(可选)

勇者斗恶龙

  • 当时的日文
  • 能显示出ascii和假名的字型
  • 就已经很厉害


添加图片注释,不超过 140 字(可选)

  • 想显示出中文字型
  • 是不可能的


日本汉字

  • 是中文的拼音文字
  • 只是假名都加在一起就至少 100+
  • 128 根本不够用


添加图片注释,不超过 140 字(可选)

  • 更何况日文里面用日本汉字
  • 虽然只有2000个不到
  • 但是是文化的象征


  • 不过假名毕竟是假的
  • 日文中最厉害的还是汉字


汉字文化

  • 日语中混有各种汉字

添加图片注释,不超过 140 字(可选)

  • 感觉根本不用翻译

添加图片注释,不超过 140 字(可选)

  • 也会造一些日本汉字

汉字

发音

含义

なぎ

风平 浪静

しずく

水滴 如雨下

しつけ

教育

さかき

寺庙里的 树

评选年度汉字

添加图片注释,不超过 140 字(可选)

  • 所以日文中的字符直接超过2000+
  • 1 个字节 是不够了
  • 至少需要 2 个字节


添加图片注释,不超过 140 字(可选)

  • 日本规格协会制定标准
  • JIS X 0212


  • 点阵字库 产生了
  • 日本汉字的黑体模式


无衬线黑体风格

  • 无衬线
  • 黑体
  • 注重实效
  • 注重清晰度



添加图片注释,不超过 140 字(可选)

  • 任何字帖一般都有两种风格
  • 板正规范的生硬风格
  • 圆润灵动的手写风格


手写风格

添加图片注释,不超过 140 字(可选)

  • 不像大写字母
  • 那么生硬


添加图片注释,不超过 140 字(可选)

  • 就像小写字母
  • 那么圆滑


  • 韩文字符又是如何编码的呢?

韩文

  • 韩文也是一种拼音文字
  • 基础字母有二十四个
  • 符号是朝鲜王朝世宗大王时创作的
  • 从此韩文有了谚文



添加图片注释,不超过 140 字(可选)

  • 但是韩国士大夫会写汉字
  • 不愿意推广谚文


拼音

  • 不过拼音文字
  • 更容易一些


添加图片注释,不超过 140 字(可选)

  • 谚文书写 普及速度 比汉字书写 快得多
  • 拼音 是有结构的

谚文结构

  • 谚文是由表音符号组合而成的
  • 有各种间架结构


添加图片注释,不超过 140 字(可选)

  • 这些声旁都发什么音呢?

声音

  • 韩文名字
  • 宋仲基(송중기)
  • 金喜善(김희선)
  • 李英爱(이영애)
  • 阿一古(아이구)
  • 圆圈不发音


添加图片注释,不超过 140 字(可选)

  • 从此就连哎呦喂(阿一古)
  • 都有了标准发音方法
  • 用拼音文字把读音固化下来


  • 谚文有多少字符呢?

谚文字符

  • 声母韵母拼写在一起算一个
  • 共 554 个


  • 而且这还不算朝鲜汉字

添加图片注释,不超过 140 字(可选)

  • 这554个基础字符导致
  • 1 个字节不够
  • 2 个字节才够


  • 韩文的字符集为
  • KS X 1001


总结

  • 日韩各有 编码格式
  • 日本
  • 有假名
  • 五十音
  • 一字节 可以勉强放下


  • 有日本汉字
  • 字符数量超过20000+



  • 韩国
  • 有谚文
  • 数量超过500
  • 一个字节 放不下


  • 有朝鲜汉字
  • 字符数量超过20000+




添加图片注释,不超过 140 字(可选)

  • 作为 汉字源头的中国
  • 究竟应该 如何对汉字 进行编码 呢?🤔



目录
相关文章
|
9天前
|
人工智能 Shell 开发工具
[oeasy]python062_在python中完成输入和输出_input_print
本文介绍了在Python中使用`input()`和`print()`函数完成输入和输出操作的基础知识。通过编写简单的程序,如问候用户和统计苹果数量,演示了如何添加提示信息、处理用户输入并输出结果。同时,回顾了上一次课程内容,包括`input`函数的参数和提示词的使用。文中还展示了如何在vim编辑器中编写和运行Python代码,并对vim和shell的基本操作进行了总结。最后提供了相关学习资源链接,方便读者进一步学习。
101 66
|
2月前
|
Unix Linux 程序员
[oeasy]python053_学编程为什么从hello_world_开始
视频介绍了“Hello World”程序的由来及其在编程中的重要性。从贝尔实验室诞生的Unix系统和C语言说起,讲述了“Hello World”作为经典示例的起源和流传过程。文章还探讨了C语言对其他编程语言的影响,以及它在系统编程中的地位。最后总结了“Hello World”、print、小括号和双引号等编程概念的来源。
122 80
|
2月前
|
人工智能 C语言 Python
[oeasy]python051_什么样的变量名能用_标识符_identifier
本文介绍了Python中变量名的命名规则,强调标识符(identifier)必须以字母或下划线开始,后续可包含字母、下划线及数字。通过`isidentifier()`函数可验证字符串是否为合法标识符。文中还探讨了为何数字不能作为标识符的开头,并提供了相关练习与解答,最后提及这些规则源自C语言的影响。
119 69
|
2月前
|
Python
[oeasy]python050_如何删除变量_del_delete_variable
本文介绍了Python中如何删除变量,通过`del`关键字实现。首先回顾了变量的声明与赋值,说明变量在声明前是不存在的,通过声明赋予其生命和初始值。使用`locals()`函数可查看当前作用域内的所有本地变量。进一步探讨了变量的生命周期,包括自然死亡(程序结束时自动释放)和手动删除(使用`del`关键字)。最后指出,删除后的变量将无法在当前作用域中被访问,并提供了相关示例代码及图像辅助理解。
122 68
|
18天前
|
人工智能 Unix Java
[oeasy]python059变量命名有什么规则_惯用法_蛇形命名法_name_convention_snake
本文探讨了Python中变量命名的几种常见方式,包括汉语拼音变量名、蛇形命名法(snake_case)和驼峰命名法(CamelCase)。回顾上次内容,我们主要讨论了使用下划线替代空格以提高代码可读性。实际编程中,当变量名由多个单词组成时,合理的命名惯例变得尤为重要。
51 9
|
23天前
|
C语言 Python
[oeasy]python058_一句话让python崩了
本文介绍了如何通过重新赋值`__builtins__`使Python环境崩溃,并探讨了下划线的来历及其在编程中的作用。文章回顾了上次内容,展示了覆盖内建模块导致系统崩溃的过程,解释了恢复方法,以及PEP 8规范中关于空格使用的建议。最后,文章总结了下划线在变量定义和提高代码可读性方面的重要性,并简述了其从打字机时代到计算机时代的演变。
30 10
|
2月前
|
Python
[oeasy]python055_python编程_容易出现的问题_函数名的重新赋值_print_int
本文介绍了Python编程中容易出现的问题,特别是函数名、类名和模块名的重新赋值。通过具体示例展示了将内建函数(如`print`、`int`、`max`)或模块名(如`os`)重新赋值为其他类型后,会导致原有功能失效。例如,将`print`赋值为整数后,无法再用其输出内容;将`int`赋值为整数后,无法再进行类型转换。重新赋值后,这些名称失去了原有的功能,可能导致程序错误。总结指出,已有的函数名、类名和模块名不适合覆盖赋新值,否则会失去原有功能。如果需要使用类似的变量名,建议采用其他命名方式以避免冲突。
45 14
|
25天前
|
Python
[oeasy]python057_如何删除print函数_dunder_builtins_系统内建模块
本文介绍了如何删除Python中的`print`函数,并探讨了系统内建模块`__builtins__`的作用。主要内容包括: 1. **回忆上次内容**:上次提到使用下划线避免命名冲突。 2. **双下划线变量**:解释了双下划线(如`__name__`、`__doc__`、`__builtins__`)是系统定义的标识符,具有特殊含义。
29 3
|
28天前
|
存储 Python
[oeasy]python056_python中下划线是什么意思_underscore_理解_声明与赋值_改名字
在Python中,下划线有多种用途。单下划线(_)常用于避免命名冲突,如将`max`改为`max_`以保留内置函数功能。双下划线(__var__)通常用于特殊方法和属性,如`__name__`、`__doc__`等。此外,单下划线(_)在交互式解释器中表示上一次表达式的值,但不建议作为普通变量名使用。总结:下划线用于避免命名冲突及特殊标识。
24 1
|
2月前
|
C语言 Python
[oeasy]python054_python有哪些关键字_keyword_list_列表_reserved_words
本文介绍了Python的关键字列表及其使用规则。通过回顾`hello world`示例,解释了Python中的标识符命名规则,并探讨了关键字如`if`、`for`、`in`等不能作为变量名的原因。最后,通过`import keyword`和`print(keyword.kwlist)`展示了Python的所有关键字,并总结了关键字不能用作标识符的规则。
41 9

热门文章

最新文章