Linux 板


LINE

: → LIAR: 如果硬碟没问题,还会有甚麽因素会卡在I/O呢? 08/07 08:26 : → LIAR: 我报告一下实际的状况,整台电脑运作真的都会顿顿的,SMB 08/07 08:27 : → LIAR: 关掉就会恢复正常。 08/07 08:27 : → bitlife: 你说5月前正常,是否5月前才开始用smb? 存档影片是只有即 08/07 09:04 : → bitlife: 时影像还是包含(你文中提到的)历史录影档案转移?单个摄影 08/07 09:06 : → bitlife: 机每秒流量? 网路是100M还是1G? 硬碟是HDD还是SDD? 要各 08/07 09:07 : → bitlife: 种因素一起看才比较好推测. 忘了还有同时多少摄影机(总秒 08/07 09:07 : → bitlife: 流量) 08/07 09:07 : 推 bitlife: 5月之後才开始用smb 08/07 09:09 : 推 bitlife: SSD 08/07 09:13 我整理一下这几个月的纪录,有点长,不好意思。 伺服器接收9台监视器资料,监视器档案先录到自己的记忆卡,再上传到伺服器, 所以应该不算即时的,但是每分钟每台都会有一个4~8MB大的新档案被上传。 硬碟是传统硬碟,伺服器是笔电装CentOS,伺服器和另外两台监视器连接的AP一起 接在P880下面,网路是100Mbit的。 平均一天会有75GB档案产生,也就是理论上每分钟平均会接收53.3MB大小的档案。 按照时间轴,伺服器有几个重大事件: 4月samba启用接收档案 + rclone自动上传到Gsuite,自动运作正常。 5月都正常。 6月18日换硬碟500GB→2T,用clonezilla转移後xfs_growfs放大,没发现异常。 6月21日中发现有error log,当时无法解读也忘记纪录,用yum update後,grub 多出一个CentOS Linux 7 Rescue f8b625c751034e15b45eb19be9e13e06的开机选项 6月22日开始有CPU过载的问题。 硬碟买来前有先整个scan过,因为时间点接近,我一开始有看smart或hdparm稍微 判断一下,没有明显异状。 7月之後才安装mcelog,/var/log/message里面抓到一段 log: Hardware event. This is not a software error. MCE 0 CPU 0 BANK 5 MISC 138a0000086 ADDR fef873c0 TIME 1593684184 Thu Jul 2 18:03:04 2020 MCG status: MCi status: Uncorrected error MCi_MISC register valid MCi_ADDR register valid Processor context corrupt MCA: corrected filtering (some unreported errors in same region) Generic CACHE Level-2 Generic Error STATUS ae0000000040110a MCGSTATUS 0 MCGCAP c07 APICID 0 SOCKETID 0 MICROCODE 26 CPUID Vendor Intel Family 6 Model 69 Hardware event. This is not a software error. MCE 1 CPU 0 BANK 6 MISC 238a0000086 ADDR fef87380 TIME 1593684184 Thu Jul 2 18:03:04 2020 MCG status: MCi status: Uncorrected error MCi_MISC register valid MCi_ADDR register valid Processor context corrupt MCA: corrected filtering (some unreported errors in same region) Generic CACHE Level-2 Generic Error STATUS ae0000000040110a MCGSTATUS 0 MCGCAP c07 APICID 0 SOCKETID 0 MICROCODE 26 CPUID Vendor Intel Family 6 Model 69 印象中每次开机都有,但之後运作除了监视器传输出问题,其他都正常。 虽然log表示有硬体问题,但无法交叉测试,加上我用其他电脑直接网芳传大档案进去, 每秒也都有正常的几MB,只有监视器上传档案会延迟,所以这个error只能先搁置。 不过怀疑过CPU有问题,想说双核心,尝试用下面方式分别停掉一个核心 /sys/devices/system/cpu/cpu0/online /sys/devices/system/cpu/cpu1/online 结果只会让CPU负载情况恶化。 因为公司因素,我没法说直接要一台新电脑取代,只能先尝试修过或是分析出 确定因素才能报修,所以目前我就卡在这边了。请问这个问题和硬体有关吗? -- 起初,他们追杀共产主义者,我没有说话,因为我不是共产主义者; 接着,他们追杀犹太人,我没有说话,因为我不是犹太人; 後来,他们追杀工会成员,我没有说话,因为我不是工会成员; 此後,他们追杀天主教徒,我没有说话,因为我是新教教徒; 最後,他们奔我而来,却再也没有人站起来为我说话了。 《First They Came(他们首次来时)》,Martin Niemoller牧师(1892-1984) --



※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 118.233.88.199 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Linux/M.1596817592.A.252.html
1F:推 mirc: 尝试先把硬碟换掉 08/08 04:01
2F:推 bitlife: 先确定硬碟是PMR(CMR),如果是SMR会变慢是很有可能的.现今 08/08 06:17
3F:→ bitlife: 硬碟SMR鱼目混珠,连NAS碟都有厂商用了SMR.前几个月各硬碟 08/08 06:18
4F:→ bitlife: 厂在民意压力下公布硬碟的PMR,SMR型号.去Storage_Zone和 08/08 06:19
5F:→ bitlife: PC_Shopping查一下型号. 我去年买一个外接硬碟用来复制整 08/08 06:20
6F:→ bitlife: 个home目录,9年前买的500GB 2.5寸大约100MB/s,新买的硬碟 08/08 06:22
7F:→ bitlife: 常常掉到10~30MB/s,查了才知道近年硬碟有SMR问题立刻退货 08/08 06:23
8F:→ bitlife: 换硬碟也要注意别再买到SMR,不知道怎麽选就买那嘶狼,目前 08/08 06:24
9F:→ bitlife: 已知那嘶狼没有SMR的(未来不知) 08/08 06:26
10F:→ bitlife: #1UemJtmt (PC_Shopping) 08/08 06:28
11F:→ bitlife: ubuntu有内建[磁碟]工具程式可以做简单的测速,CentOS应该 08/08 06:54
12F:→ bitlife: 也有,用测速就可以发现PMR的曲线相对很稳定维持定速月高 08/08 06:55
13F:→ bitlife: 速,SMR忽快忽慢,一旦开始掉速後的忽快也不会很快 08/08 06:56
14F:→ bitlife: 且 08/08 06:56
15F:→ LIAR: 确定是SMR无误,囧 08/08 07:43
16F:→ bitlife: 帮你写个惨字... 08/08 08:08
17F:→ LIAR: 惨!不过先撇开公司的事情,其实我也好奇CPU的那个error 08/08 22:18
18F:→ LIAR: 到底有没有关联就是了,解读不出来XD 08/08 22:19
19F:→ asdfghjklasd: HDD 因为速度慢写不下去,会变成Q在系统里 08/08 22:55
20F:→ asdfghjklasd: RAM CPU 都可能会愈来愈高的使用率 08/08 22:55
21F:→ LIAR: 不过我用自己电脑传档案进去,还是有几个MB/S耶?所以SMR 08/09 00:12
22F:→ LIAR: 我也是有怀疑是否为主因。 08/09 00:13
23F:→ LIAR: 我是有遇过硬碟坏轨让电脑龟在那边,但是SMR会这麽严重吗? 08/09 00:14
24F:→ bitlife: 建议可以从仅1台摄影机流量开始测试,逐步增加连线的摄影 08/09 10:32
25F:→ bitlife: 机数量,看看在数量几台的时候出现问题.如果wa是随数量增 08/09 10:32
26F:→ bitlife: 加而恶化,很可能真的是SMR造成的问题.我home的资料用前面 08/09 10:33
27F:→ bitlife: 提的500GB 2.5寸,我记得第一次备份只花了大概4小时.同样 08/09 10:33
28F:→ bitlife: 时期的另两台2.5寸 500GB,放在我目前的a300中,一台当home 08/09 10:34
29F:→ bitlife: 不定期用dd将整颗500GB硬体进行全部磁区的完整备份,也不 08/09 10:35
30F:→ bitlife: 到2个小时(整颗硬碟dd比home的rsync快是正常).用上面提的 08/09 10:36
31F:→ bitlife: SMR,我晚上11点左右丢给它去rsync,早上起来至少经过7小时 08/09 10:36
32F:→ bitlife: 还才备份到1x%,看了就晕倒,估计要1~2天才完成500GB的初次 08/09 10:37
33F:→ bitlife: rsync.查了资料就连络厂商退货了 08/09 10:37
34F:→ bitlife: 500GB硬碟 08/09 10:38
35F:→ bitlife: 除非我刚好买到碟王,不然SMR就是如此的可怕 XD 08/09 10:39
36F:→ bitlife: 上面的资料凭印象,时间和%数可能有问题,但初次rsync要超 08/09 10:42
37F:→ bitlife: 过24小时是绝对没记错的 08/09 10:42
38F:→ bitlife: 光是快速格式化就要闪灯超级超级久的硬碟(我用几种格式试 08/09 10:43
39F:→ bitlife: 过),我也是第1次遇到 08/09 10:43
40F:→ bitlife: 快速格式化真的久到我都以为当了 XD 08/09 10:44







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:WOW站内搜寻

TOP