LeetCode刷题 Shell编程四则 | 194. 转置文件 192. 统计词频 193. 有效电话号码 195. 第十行-阿里云开发者社区

LeetCode刷题 Shell编程四则 | 194. 转置文件 192. 统计词频 193. 有效电话号码 195. 第十行

2024-09-29 60

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 本文提供了几个Linux shell脚本编程问题的解决方案，包括转置文件内容、统计词频、验证有效电话号码和提取文件的第十行，每个问题都给出了至少一种实现方法。

194. 转置文件

给定一个文件 file.txt，转置它的内容。

你可以假设每行列数相同，并且每个字段由 ' ' 分隔。

示例：

假设 file.txt 文件内容如下：

name age
alice 21
ryan 30

应当输出：

name alice ryan
age 21 30

参考解法

解法一：

# Read from the file file.txt and print its transposed content to stdout.
# 获取第一行，然后用wc来获取列数
COLS=`head -1 file.txt | wc -w`
# 使用awk依次去输出文件的每一列的参数，然后用xargs做转置
for (( i = 1; i <= $COLS; i++ )); do
    # 这里col就是在代码里要替换的参数，而它等于$i
    awk -v col=$i '{print $col}' file.txt | xargs
done

# 来源：https://leetcode-cn.com/problems/transpose-file/solution/194-chao-97de-wcawkxargsjie-fa-by-ffretu-a469/

解法二：

awk '{
    for (i=1;i<=NF;i++){
        if (NR==1){  # 天坑！之前这里写成了NF，怎么输出每行开头都多1个空格
            res[i]=$i
       #    print  res[i]
        }
        else{
        #    print  res[i]
            res[i]=res[i]" "$i
        #    print  res[i]
        }
    }
}END{
    for(j=1;j<=NF;j++){
        print res[j]
    }
}' file.txt

#  来源：https://www.cocobolo.top/linux/2019/07/04/194.%E8%BD%AC%E7%BD%AE%E6%96%87%E4%BB%B6(awk).html

解析

awk是一行一行地处理文本文件，运行流程是：
先运行BEGIN后的{Action}，相当于表头  
再运行{Action}中的文件处理主体命令  
最后运行END后的{Action}中的命令
有几个经常用到的awk常量：NF是当前行的field字段数；NR是正在处理的当前行数。

注意到是转置，假如原始文本有m行n列（字段），那么转置后的文本应该有n行m列，即原始文本的每个字段都对应新文本的一行。我们可以用数组res来储存新文本，将新文本的每一行存为数组res的一个元素。

在END之前我们遍历file.txt的每一行，并做一个判断：在第一行时，每碰到一个字段就将其按顺序放在res数组中；从第二行开始起，每碰到一个字段就将其追加到对应元素的末尾（中间添加一个空格）。

文本处理完了，最后需要输出。在END后遍历数组，输出每一行。注意printf不会自动换行，而print会自动换行。

解法三：

# 解题思路为一列一列的读取文本，再使用xargs命令将列平铺开，达到转置的效果。
# 其中读取列可以使用cut命令或awk命令。
# cut取列方法如下，其中f1意思为取第一列。
# cut -d' ' -f1 file.txt
# awk取列方法如下，其中$1意思为取第一列
# awk '{print $1}' file.txt

# 故解法一:

COUNT=`head -1 file.txt | wc -w`
for (( i = 1; i <= $COUNT; i++ )); do
cut -d' ' -f$i file.txt | xargs
done

# 解法二:

COUNT=`head -1 file.txt | wc -w`
for (( i = 1; i <= $COUNT; i++ )); do
awk -v arg=$i '{print $arg}' file.txt | xargs
done


# 来源：https://leetcode-cn.com/problems/transpose-file/solution/xargszhuan-zhi-by-rubbersoul322-s6u5/

192. 统计词频

写一个 bash 脚本以统计一个文本文件 words.txt 中每个单词出现的频率。

为了简单起见，你可以假设：

words.txt只包括小写字母和 ' ' 。
每个单词只由小写字母组成。
单词间由一个或多个空格字符分隔。

示例:

假设 words.txt 内容如下：

the day is sunny the the
the sunny is is

你的脚本应当输出（以词频降序排列）：

the 4
is 3
sunny 2
day 1

说明:

不要担心词频相同的单词的排序问题，每个单词出现的频率都是唯一的。
你可以使用一行 Unix pipes 实现吗？

awk '{for(i=1;i<=NF;i++){asso_array[$i]++;}};END{for(w in asso_array){print w,asso_array[w];}}' words.txt | sort -rn -k2

#  cat words.txt | xargs -n1 | sort | uniq -c | sort -rn | awk '{print $2,$1}'


# 参考链接：https://leetcode-cn.com/problems/word-frequency/solution/jiu-shi-zhe-yao-ji-zhi-qie-wan-mei-ha-ha-by-novice/
#  https://mp.weixin.qq.com/s/EI63RZZcPzJT4c0zl8XQSA

193. 有效电话号码

给定一个包含电话号码列表（一行一个电话号码）的文本文件 file.txt，写一个单行 bash 脚本输出所有有效的电话号码。

你可以假设一个有效的电话号码必须满足以下两种格式： (xxx) xxx-xxxx 或 xxx-xxx-xxxx。（x 表示一个数字）

你也可以假设每行前后没有多余的空格字符。

示例：

假设 file.txt 内容如下：

987-123-4567
123 456 7890
(123) 456-7890

你的脚本应当输出下列有效的电话号码：

987-123-4567
(123) 456-7890

# grep

grep -P '^([0-9]{3}-|\([0-9]{3}\) )[0-9]{3}-[0-9]{4}$' file.txt

# awk/gawk

awk '/^([0-9]{3}-|\([0-9]{3}\) )[0-9]{3}-[0-9]{4}$/' file.txt

# 或者

gawk '/^([0-9]{3}-|\([0-9]{3}\) )[0-9]{3}-[0-9]{4}$/' file.txt

# 参考链接：https://leetcode-cn.com/problems/valid-phone-numbers/solution/zheng-ze-biao-da-shi-zhong-xian-ding-fu-yu-ding-we/

195. 第十行

给定一个文本文件 file.txt，请只打印这个文件中的第十行。

示例:

假设 file.txt 有如下内容：

Line 1
Line 2
Line 3
Line 4
Line 5
Line 6
Line 7
Line 8
Line 9
Line 10

你的脚本应当显示第十行：

Line 10

说明:
1. 如果文件少于十行，你应当输出什么？
2. 至少有三种不同的解法，请尝试尽可能多的方法来解题。

# sed -n "10p" file.txt

# 参考链接：https://leetcode-cn.com/problems/tenth-line/solution/shuang-bai-jie-da-by-ffreturn-68bk/

# cat file.txt|head -n 10|tail -n +10
# 参考链接：https://leetcode-cn.com/problems/tenth-line/solution/195di-shi-xing-by-erfeng-v-5r6g/

# grep -n "" file.txt | grep -w '10' | cut -d: -f2
# awk '{if(NR==10){print $0}}' file.txt
# Read from the file file.txt and output the tenth line to stdout.
readfile="file.txt"
row_num=$(cat ${
    readfile} | wc -l)
if [ ${row_num} -lt 10 ]
    then
        echo 
else
    sed -n "10p" $readfile
fi

# 参考链接：https://leetcode-cn.com/problems/tenth-line/solution/ni-yun-xing-guo-ma-by-novice2master/

其中文件行数row_num可以使用如下几种方式获取

awk '{print NR}' file.txt | tail -n1
10
awk 'END{print NR}' file.txt 
10
grep -nc "" file.txt 
10
grep -c "" file.txt 
10
grep -vc "^$" file.txt 
10
grep -n "" file.txt|awk -F: '{print '}|tail -n1 | cut -d: -f1
10
grep -nc "" file.txt
10
sed -n "$=" file.txt 
10
wc -l file.txt 
10 file.txt
cat file.txt | wc -l
10
wc -l file.txt | cut -d' ' -f1
10

作者：novice2master
链接：https://leetcode-cn.com/problems/tenth-line/solution/ni-yun-xing-guo-ma-by-novice2master/
来源：力扣（LeetCode）
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

LeetCode刷题 Shell编程四则 | 194. 转置文件 192. 统计词频 193. 有效电话号码 195. 第十行

194. 转置文件

参考解法

解法一：

解法二：

解法三：

192. 统计词频

193. 有效电话号码

195. 第十行

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

LeetCode刷题 Shell编程四则 | 194. 转置文件 192. 统计词频 193. 有效电话号码 195. 第十行

参考解法

解法一：

解法二：

解法三：

热门文章

最新文章

相关课程

相关电子书

相关实验场景