Linux 笔记


Linux 笔记

1.服务无响应

# 接口调用返时出现ECONNRESET,那么应该是监听端口的全连接队列满了,系统无法接受新
netstat -ano|grep <PROT> | grep LISTEN
netstat -ano|grep 11008 | grep LISTEN
11007

2.链接数

# 输出每个ip的连接数,以及总的各个状态的连接数
netstat -n | awk '/^tcp/ {n=split($(NF-1),array,":");if(n<=2)++S[array[(1)]];else++S[array[(4)]];++s[$NF];++N} END {for(a in S){printf("%-20s %s\n", a, S[a]);++I}printf("%-20s %s\n","TOTAL_IP",I);for(a in s) printf("%-20s %s\n",a, s[a]);printf("%-20s %s\n","TOTAL_LINK",N);}'

# 统计所有连接状态, 
# CLOSED:无连接是活动的或正在进行
# LISTEN:服务器在等待进入呼叫
# SYN_RECV:一个连接请求已经到达,等待确认
# SYN_SENT:应用已经开始,打开一个连接
# ESTABLISHED:正常数据传输状态
# FIN_WAIT1:应用说它已经完成
# FIN_WAIT2:另一边已同意释放
# ITMED_WAIT:等待所有分组死掉
# CLOSING:两边同时尝试关闭
# TIME_WAIT:主动关闭连接一端还没有等到另一端反馈期间的状态
# LAST_ACK:等待所有分组死掉
p s znetstat -n | awk '/^tcp/ {++state[$NF]} END {for(key in state) print key,"\t",state[key]}'

# 查找较多time_wait连接
netstat -n|grep TIME_WAIT|awk '{print $5}'|sort|uniq -c|sort -rn|head -n20

3.iostat(磁盘IO情况监控)

iostat -xz 1
 
# r/s, w/s, rkB/s, wkB/s:分别表示每秒读写次数和每秒读写数据量(千字节)。读写量过大,可能会引起性能问题。
# await:IO操作的平均等待时间,单位是毫秒。这是应用程序在和磁盘交互时,需要消耗的时间,包括IO等待和实际操作的耗时。如果这个数值过大,可能是硬件设备遇到了瓶颈或者出现故障。
# avgqu-sz:向设备发出的请求平均数量。如果这个数值大于1,可能是硬件设备已经饱和(部分前端硬件设备支持并行写入)。
# %util:设备利用率。这个数值表示设备的繁忙程度,经验值是如果超过60,可能会影响IO性能(可以参照IO操作平均等待时间)。如果到达100%,说明硬件设备已经饱和。
# 如果显示的是逻辑设备的数据,那么设备利用率不代表后端实际的硬件设备已经饱和。值得注意的是,即使IO性能不理想,也不一定意味这应用程序性能会不好,可以利用诸如预读取、写缓存等策略提升应用性能。

4.free(内存使用情况)

free -m
 
eg:
 
     total       used       free     shared    buffers     cached
Mem:          1002        769        232          0         62        421
-/+ buffers/cache:          286        715
Swap:          1153          0       1153
 
第一部分Mem行:
total 内存总数: 1002M
used 已经使用的内存数: 769M
free 空闲的内存数: 232M
shared 当前已经废弃不用,总是0
buffers Buffer 缓存内存数: 62M
cached Page 缓存内存数:421M
 
关系:total(1002M) = used(769M) + free(232M)
 
第二部分(-/+ buffers/cache):
(-buffers/cache) used内存数:286M (指的第一部分Mem行中的used – buffers – cached)
(+buffers/cache) free内存数: 715M (指的第一部分Mem行中的free + buffers + cached)
 
可见-buffers/cache反映的是被程序实实在在吃掉的内存,而+buffers/cache反映的是可以挪用的内存总数.
 
第三部分是指交换分区

5.vmstat(给定时间监控CPU使用率, 内存使用, 虚拟内存交互, IO读写)

# 2表示每2秒采集一次状态信息, 1表示只采集一次(忽略既是一直采集)
vmstat 2 1
 
eg:
r b swpd free buff cache si so bi bo in cs us sy id wa
1 0 0 3499840 315836 3819660 0 0 0 1 2 0 0 0 100 0
0 0 0 3499584 315836 3819660 0 0 0 0 88 158 0 0 100 0
0 0 0 3499708 315836 3819660 0 0 0 2 86 162 0 0 100 0
0 0 0 3499708 315836 3819660 0 0 0 10 81 151 0 0 100 0
1 0 0 3499732 315836 3819660 0 0 0 2 83 154 0 0 100 0
  • r 表示运行队列(就是说多少个进程真的分配到CPU),我测试的服务器目前CPU比较空闲,没什么程序在跑,当这个值超过了CPU数目,就会出现CPU瓶颈了。这个也和top的负载有关系,一般负载超过了3就比较高,超过了5就高,超过了10就不正常了,服务器的状态很危险。top的负载类似每秒的运行队列。如果运行队列过大,表示你的CPU很繁忙,一般会造成CPU使用率很高。
  • b 表示阻塞的进程,这个不多说,进程阻塞,大家懂的。
  • swpd 虚拟内存已使用的大小,如果大于0,表示你的机器物理内存不足了,如果不是程序内存泄露的原因,那么你该升级内存了或者把耗内存的任务迁移到其他机器。
  • free 空闲的物理内存的大小,我的机器内存总共8G,剩余3415M。
  • buff Linux/Unix系统是用来存储,目录里面有什么内容,权限等的缓存,我本机大概占用300多M
  • cache cache直接用来记忆我们打开的文件,给文件做缓冲,我本机大概占用300多M(这里是Linux/Unix的聪明之处,把空闲的物理内存的一部分拿来做文件和目录的缓存,是为了提高 程序执行的性能,当程序使用内存时,buffer/cached会很快地被使用。)
  • si 每秒从磁盘读入虚拟内存的大小,如果这个值大于0,表示物理内存不够用或者内存泄露了,要查找耗内存进程解决掉。我的机器内存充裕,一切正常。
  • so 每秒虚拟内存写入磁盘的大小,如果这个值大于0,同上。
  • bi 块设备每秒接收的块数量,这里的块设备是指系统上所有的磁盘和其他块设备,默认块大小是1024byte,我本机上没什么IO操作,所以一直是0,但是我曾在处理拷贝大量数据(2-3T)的机器上看过可以达到140000/s,磁盘写入速度差不多140M每秒。
  • bo 块设备每秒发送的块数量,例如我们读取文件,bo就要大于0。bi和bo一般都要接近0,不然就是IO过于频繁,需要调整。
  • in 每秒CPU的中断次数,包括时间中断。
  • cs 每秒上下文切换次数,例如我们调用系统函数,就要进行上下文切换,线程的切换,也要进程上下文切换,这个值要越小越好,太大了,要考虑调低线程或者进程的数目,例如在apache和nginx这种web服务器中,我们一般做性能测试时会进行几千并发甚至几万并发的测试,选择web服务器的进程可以由进程或者线程的峰值一直下调,压测,直到cs到一个比较小的值,这个进程和线程数就是比较合适的值了。系统调用也是,每次调用系统函数,我们的代码就会进入内核空间,导致上下文切换,这个是很耗资源,也要尽量避免频繁调用系统函数。上下文切换次数过多表示你的CPU大部分浪费在上下文切换,导致CPU干正经事的时间少了,CPU没有充分利用,是不可取的。
  • us 用户CPU时间,我曾经在一个做加密解密很频繁的服务器上,可以看到us接近100,r运行队列达到80(机器在做压力测试,性能表现不佳)。
  • sy 系统CPU时间,如果太高,表示系统调用时间长,例如是IO操作频繁。
  • id 空闲 CPU时间,一般来说,id + us + sy = 100,一般我认为id是空闲CPU使用率,us是用户CPU使用率,sy是系统CPU使用率。
  • wt 等待IO CPU时间。

6.sar(CPU,网络,内存,I/O)

a.网络吞吐

# sar命令在这里可以查看网络设备的吞吐率。在排查性能问题时,可以通过网络设备的吞吐量,判断网络设备是否已经饱和
sar -n DEV 1
 
# sar命令在这里用于查看TCP连接状态,其中包括:
# active/s:每秒本地发起的TCP连接数,既通过connect调用创建的TCP连接;
# passive/s:每秒远程发起的TCP连接数,即通过accept调用创建的TCP连接;
# retrans/s:每秒TCP重传数量;
# TCP连接数可以用来判断性能问题是否由于建立了过多的连接,进一步可以判断是主动发起的连接,还是被动接受的连接。TCP重传可能是因为网络环境恶劣,或者服务器压力过大导致丢包
sar -n TCP,ETCP 1
# 网络统计(-n)命令:
sar -n 2 3
# IFACE: 网络接口名称
# rxpck/s: 每秒收包的数量
# txpck/s: 每秒发包的数量
# rxkB/s: 每秒收的数据量(kB为单位)
# txkB/s: 每秒发的数据量(kB为单位)

b.CPU监控

# 整体CPU使用统计(-u)命令:
sar  -u  1  2    
#(1代表采集时间,2代表采集次数)
# %user: 用户态下CPU使用时间比率
# %system: 内核态下CPU使用时间比率
# %iowait: CPU等待I/O占用时间比率
# %idle: CPU空闲时间比率

# 各个CPU使用统计(-P)命令:
sar -p ALL 1 1
# %user: 用户态下CPU使用时间比率
# %system: 内核态下CPU使用时间比率
# %iowait: CPU等待I/O占用时间比率
# %idle: CPU空闲时间比率
# 查看cpu 使用率 
sar -P ALL -u 2 2
08:21:16 PM     CPU     %user     %nice   %system   %iowait    %steal     %idle
08:21:18 PM     all      2.25      0.00     48.25      0.00      0.00     49.50
08:21:18 PM       0      0.50      0.00      1.00      0.00      0.00     98.51
08:21:18 PM       1      4.02      0.00     95.98      0.00      0.00      0.00

c.内存

# 内存使用情况统计(-r):命令:
sar -r 1 2
# kbmemfree:空闲物理内存量;
# kbmemused:使用中的物理内存量;
# %memused:物理内存量使用率;
# kbbuffers:内核中作为缓冲区使用的物理内存容量;
# kbcacheed:内核中作为缓存使用的物理内存容量;
# kbswpfree:交换区的空闲容量;
# kbswpused:使用中的交换区容量;
# kbmemfree与kbmemused字段分别显示内存的未使用与已使用空间,后面跟着的是已使用空间的百分比(%memused字段)。
# kbbuffers与kbcached字段分别显示缓冲区与系统全域的数据存取量,单位为KB。

d.I/O

# 整体I/O情况(-b)命令:
sar -b 1 2
# tps: 每秒向磁盘设备请求数据的次数,包括读、写请求,为rtps与wtps的和。出于效率考虑,每一次IO下发后并不是立即处理请求,而是将请求合并(merge),这里tps指请求合并后的请求计数。
# rtps: 每秒向磁盘设备的读请求次数
# wtps: 每秒向磁盘设备的写请求次数
# bread: 每秒从磁盘读的bytes数量
# bwrtn: 每秒向磁盘写的bytes数量

# 各个I/O设备情况(-d)命令:
sar -d 1 2

7.perf(CPU)

sudo yum install perf

yum install sysstat
 
systemctl start sysstat
systemctl enable sysstat

# 用 perf 工具采样:
perf record -a -e cycles -o cycle.perf -g sleep 10
# [ perf record: Woken up 18 times to write data ]
# [ perf record: Captured and wrote 4.953 MB cycle.perf (~216405 samples) ]
# 注:”-a”表示对所有CPU采样,如果只需针对特定的CPU,可以使用”-C”选项。

# 把采样的数据生成报告:
perf report -i cycle.perf | more

...
# Samples: 40K of event 'cycles'
# Event count (approx.): 18491174032
#
# Overhead          Command                   Shared Object              Symbol
# ........  ...............  ..............................    ................
#
    75.65%              cat  [kernel.kallsyms]                 [k] __clear_user                     
                        |
                        --- __clear_user
                           |          
                           |--99.56%-- read_zero
                           |          vfs_read
                           |          sys_read
                           |          system_call_fastpath
                           |          __GI___libc_read
                            --0.44%-- [...]
 
     2.34%              cat  [kernel.kallsyms]                 [k] system_call                      
                        |
                        --- system_call
                           |          
                           |--56.72%-- __write_nocancel
                           |          
                            --43.28%-- __GI___libc_read

8.top & perf:

# top 的使用,top 命令也是Linux下的性能分析工具,能够实时显示系统中各个进程的资源占用状况。
# 使用 perf 之前,可以先用 top 命令查看指定进程(xxx)的CPU占用率是否异常,命令如下:

top -p `ps aux | grep "xxx" | grep -v grep | cut -c 9-15`
# 上面命令的含义是通过 top 查看指定进程(xxx)的整体运行情况,其中,

top -p:指定进程
top -d 1:指定屏幕刷新时间,1s刷新一次
top -b:表示以批处理模式操作
ps aux:列出所有进程
grep:查找指定进程
grep -v:反向查找
cut -c 9-15:选择每行指定列的字符
# 4、perf 的使用
# 使用 perf 进行性能分析,主要使用下面两个命令:

# perf record:保存perf追踪的内容,文件名为perf.data
# perf report:解析perf.data的内容
# 比如要分析进程 xxx,启动该进程后,首先启动使用下面命令:

sudo perf record -a --call-graph dwarf -p `ps aux | grep "xxx" | grep -v grep | cut -c 9-15` -d 1 -b

perf record -g XXX 对 XXX 程序的热点和调用栈进行采样
其中,
-a:表示对所有CPU采样
--call-graph dward:表示分析调用栈的关系
-p:表示分析指定的进程
通过 Ctrl + C 结束后,会生成 perf.data 文件,然后通过 report 导出报告,即可以查看 main 函数和子函数的CPU平均占用率。

sudo perf report -i perf.data > perf.txt

# 已知PID 查看目录
lsof -p PID | grep cwd

9.高频:

磁盘:df -h
网络:netstat -nat | awk '{print $6}' | sort | uniq -c | sort -rn
查看服务器长链接:netstat -an | grep 8080 | wc -l
IO:iostat
内存:free -m
CPU:top -Hp
JVM:jstack(线程)、jmap(内存)、jstat(GC)
其他工具:JVisual、MAT、arthas
提取文件权限: sudo chmod +777 文件路径名
netstat -tln
netstat -tln | grep 9090

10.日志:

cat info.log | grep -n -B100 -A100 'test' | tail -n 300 

cat info.0.log | grep -n -A2 'test' | grep -n -A2 'hello'

cat info.0.log | grep -n 'test'

tail -100f xx.logs

11.firewalld

# 防火墙是否关闭:
systemctl status firewalld
# 关闭防火墙:
systemctl stop firewalld
# 查看所有打开的端口: 
firewall-cmd --zone=public --list-ports
# 开放端口:
firewall-cmd --zone=public --add-port=80/tcp --permanent
# 重载防火墙:
firewall-cmd --reload
# 防火墙关闭端口:
firewall-cmd --zone=public --remove-port=80/tcp --permanent
# 查看端口占用情况
netstat -anp | grep 8080
netstat -tln | grep 8080
# 具体程序
lsof -i :8080

12.cmd

# 查找端口
netstat -aon|findstr  8080
# 停止进程
taskkill /f /im 14416
# 参数可显示端口对应的pid
netstat -o
# -a即所有端口,-p指明使用的协议,udp即udp协议
netstat -ao -p udp
# 查看42152 pid对应的进程名称
tasklist | findstr /i "42152" 

# 测试端口是否开放
telnet IP/域名 端口
# 关机(win+r)
shutdown -s -t 3600 # 60min
shutdown -s -t 600    # 10min

# 撤销
shutdown -a 

13.Docker :

# 启动Docker 
systemctl start docker 
#查看是否启动 
docker ps -a 
#查看容器 
docker images 
sudo docker container ls 
# 创建和启动容器 
docker run -d --restart=always -p 27017:27017 --name mymongo -v /data/db:/data/db -d mongo 
# 进入容器 
docker exec -it 0ccbb13c81ad  bash 
docker exec -it mymongo/bin/bash 
# 退出容器
ctrl + P + Q
# 时区
-v /etc/localtime:/etc/localtime 

14.Redis:

# 停止
redis-cli -h 127.0.0.1 -p 6379 shutdown
redis-cli -h 127.0.0.1 -p 6379 -u 1999 shutdown
kill -9 pid
# 启动
redis-server /绝对路径/redis.conf

15.mongoDB:

# 使用MongoDB客户端进行操作 
mongo 
#查询所有的数据库
show dbs

16.GitHub 搜索:

in:name test               #仓库标题搜索含有关键字test
in:descripton test         #仓库描述搜索含有关键字
in:readme test             #Readme文件搜素含有关键字
stars:>3000 test           #stars数量大于3000的搜索关键字
stars:1000..3000 test      #stars数量大于1000小于3000的搜索关键字
forks:>1000 test           #forks数量大于1000的搜索关键字
forks:1000..3000 test      #forks数量大于1000小于3000的搜索关键字
size:>=5000 test           #指定仓库大于5000k(5M)的搜索关键字
pushed:>2019-02-12 test    #发布时间大于2019-02-12的搜索关键字
created:>2019-02-12 test   #创建时间大于2019-02-12的搜索关键字
user:test                  #用户名搜素
license:apache-2.0 test    #明确仓库的 LICENSE 搜索关键字
language:java test         #在java语言的代码中搜索关键字
user:test in:name test     #组合搜索,用户名test的标题含有test的

17.maven:

a.命令

mvn tomcat:run        #运行maven工程
mvn -v                #查看maven配置
mvn clean            #删除-->target目录    ---清理生命周期---
##---||默认生命周期||---##
mvn compile           #编译出-->target目录    src\main
mvn text            #测试            src\test  &&  src\main
mvn package           #打包
mvn install          #打包&安装到本地仓库
mvn deploy            #发布
mvn clean install -e -U  #maven执行强制更新命令
# VM Options 
# 配置完可忽略安全校验[一些依赖下载不到]
-Dmaven.wagon.http.ssl.insecure=true -Dmaven.wagon.http.ssl.allowall=true
# IDEA根据maven archetype的本质,其实是执行mvn archetype:generate命令,该命令执行时,需要指定一个archetype-catalog.xml文件。该命令的参数-DarchetypeCatalog,可选值为:remote,internal,local等,用来指定archetype-catalog.xml文件从哪里获取。
# 优先从本地仓库获取[maven打包慢]
-DarchetypeCatalog=internal
# 控制台乱码
-Dfile.encoding=GBK

b.maven 上传私库:

mvn deploy:deploy-file -DgroupId=com.test -DartifactId=test-java -Dversion=0.0.1-SNAPSHOT -Dpackaging=jar -Dfile=test-java-0.0.1-SNAPSHOT.jar -Durl=http://admin:admin123@192.168.1..7:8081/nexus/content/repositories/snapshots

18.JS脚本

// url javascript:
document.querySelector(".tab").children[1].click();
document.querySelector(".setCode").click();
document.querySelector("input").click();
document.querySelector("input").value=123456; document.querySelector(".submitBtn").children[0].click();

// B站倍速
document.querySelector('bwp-video').playbackRate=3

19.nginx

#启动命令:
start nginx
#停止命令(直接退出):
nginx -s stop 
#停止命令(保存并退出):
nginx -s quit
#重新加载配置文件:
nginx -s reload

20.hexo

npm install -g hexo-cli    #安装hexo框架
hexo -v    #查看hexo版本
mkdir blog    #创建blog目录
cd blog     #进入blog目录
sudo hexo init     #生成博客 初始化博客
hexo s    #启动本地博客服务
http://localhost:4000/    #本地访问地址
hexo n "我的第一篇文章" #创建新的文章 

npm audit fix --force
yarn add hexo-theme-aurora

#返回blog目录
hexo clean #清理
hexo g #生成
#Github创建一个新的仓库 YourGithubName.github.io
cnpm install --save hexo-deployer-git #在blog目录下安装git部署插件
#配置_config.yml 
# Deployment
## Docs: https://hexo.io/docs/deployment.html
deploy:
  type: git
  repo: https://github.com/YourGithubName/YourGithubName.github.io.git
  branch: master
hexo d    #部署到Github仓库里
https://YourGithubName.github.io/  #访问这个地址可以查看博客
git clone https://github.com/litten/hexo-theme-yilia.git themes/yiliac
#下载yilia主题到本地
#修改hexo根目录下的 _config.yml 文件 : theme: yilia
hexo c    #清理一下
hexo g    #生成
hexo d    #部署到远程Github仓库
https://YourGithubName.github.io/  #查看博客

npm install hexo-theme-aurora --save
cp -rf ./node_modules/hexo-theme-aurora/_config.yml ./_config.aurora.yml

21.markdown

# 1.md插入视频 对应语法如下,这两个都可以:
<video src="视频链接"></video>
<iframe height=498 width=510 src="视频链接">
# 2.音频:
<audio src="mp3文件链接地址"></audio>
<iframe frameborder="no" border="0" marginwidth="0" marginheight="0" width=330 height=86 src="//music.163.com/outchain/player?type=2&id=33367876&auto=1&height=66"></iframe>

文章作者: Anubis
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 Anubis !
评论
  目录