本文由作者朱益军授权网易云社区发布。
背景
维护巡检云主机时,发现有一台运行redis的云主机状态显示维护中,登录该实例查看,系统盘变成readonly。本文简单分析该问题出现原因,并为运维人员提供常见处理方法及建议。
故障分析
查看云主机dmesg信息发现,系统运行过程中python进程发生segfault,随后vda(云主机配置virtio-blk,故盘符显示为vda)系统盘I/O error。
基本可确定是业务把系统盘写坏了。通常发生该问题的场景有二:
一、云主机和宿主机IO繁忙,云主机的IO请求得不到及时的响应,从而产生磁盘IO错误,为了保护磁盘数据会remount分区为只读;
二、云主机被强制关机,导致磁盘出现文件系统错误故障。
故障处理
通常的解决方法是重启系统以root用户进入单用户模式, 运行fsck.ext3 –y /dev/vda(如果是ext4使用fsck.ext4修复),/dev/vda是系统/根分区。修复完reboot进入系统。以debian系统为例:
1、重启系统,grub菜单会出现正常启动和修复模式( recovery mode )启动两个菜单项,选择修复模式启动;
2、进入修复模式,运行fsck工具修复;
3、重启进入正常模式启动。
注意:
1、运维人员在重启云主机之前尽量先收集一些关键的日志,如/var/log下面的一些日志、dmesg等,有条件也要收集宿主机的日志;
2、fsck是Linux内核自带工具,它不仅可以对文件系统进行扫描,还能修正文件系统的一些问题。 fsck扫描文件系统时一定要在单用户模式、修复模式或把设备umount后进行。建议在单用户模式下运行。如果扫描正常运行中的系统,会造成系统文件损坏,需要root权限执行。
建议与思考
1、当前开发要定位问题,需要申请宿主机权限等流程,无法及时上去定位;
2、当前云主机的日志收集功能尚不完善,呈现的日志比较杂、乱、实用性不高,需要适当进行修改调整。另外,运维人员也不知道要收集哪些日志可支撑开发定位;
开发正在考虑开发一个一键式日志收集工具,集成到版本中,定期采集系统数据并归档,或者在发生故障时,由运维先收集分析,再交给开发定位,这样效率会高一些。
更多网易技术、产品、运营经验分享请访问 网易云社区 。
相关文章:
【推荐】 网易云易盾发布多国家多语种内容安全服务,助力中国互联网出海
【推荐】 Spring-Boot自定义Starter实践
【推荐】 一文带你了解 Raft 一致性协议的关键点
云主机文件系统readonly处理案例
一、云主机和宿主机IO繁忙,云主机的IO请求得不到及时的响应,从而产生磁盘IO错误,为了保护磁盘数据会remount分区为只读; 二、云主机被强制关机,导致磁盘出现文件系统错误故障。故障处理 通常的解决方法是重启系统以root用户进入单用户模式, 运行fsck.ext3 –y \/de...
linux文件系统只读linux文件系统只读
1、首先连接上linux主机,进入等待输入指令的linux命令行状态。2、通过cd指令进入到要设置文件的所在目录,再通过ll指令获取当前test文件的权限状态。3、输入:chmod444test.txt,再按回车。4、最后输入ll指令查看到test.txt的文件权限已经变为了只读。centos编辑好文件显示为只读保存不了?我的:centos编辑...
ubuntu系统怎样更改readonly权限文件
这种情况是因为vi文件之后,没有退出,在另外的窗口vi了文件。执行ll -al删除 跟同名文件的隐藏文件, 例如 xxx.swp
ubuntu系统怎样更改readonly权限文件
sudo chmod 777 \/...\/file 如果是系统文件,修改文件后要改回readonly readonly:sudo chmod 440 \/...\/file
装win10 出现ATTEMPTED_WRITE_TO_READONLY怎么办?
错误名称 0x000000BE:ATTEMPTED_WRITE_TO_READONLY_MEMORY故障分析 0x000000BE错误表示硬件设备的驱动程序试图向只读内存错误地写入数据。这个错误一般是因为硬件设备驱动程序存在BUG或安装不正确引起的。如果遇到0x000000BE错误,建议检查一下最近有没有安装或者升级过任何硬件设备驱动程序、BIOS及Firmware。如果...
联想电脑移动硬盘文件变成只读电脑所有文件夹变成只读如何解决_百度...
首先打开文件所在的磁盘。6. 移动硬盘里的文件无法删除且被标记为只读 1、通过修改文件只读属性删除:右键单击该文件,在属性中将只读选项去掉勾,保存之后即可删除 2、通过pe系统删除:时常会遇到一些残留文件,因为在删除该软件时某些文件扔在内存中未清理或被占用导致删除失败,这时可以通过安装硬盘版pe...
虚拟机怎样打开实际主机的文件
1、在vmware软件对应的虚拟主机窗口中,点击【编辑虚拟机设置】来打开这个设置。2、在对于的虚拟主机设置窗口下,依次点击【选项】--->【共享文件夹】,然后看到虚拟主机设置窗口的右侧。3、在虚拟机选项下右侧的共享文件夹项目内,在【总是启用】前面打勾,再在【在windows客户机中映射为网络驱动器】...
电脑上出现attempt to write a readonly database 提示 并且一直关不...
原因:Go TOP应用程序造成的。1、首先双击打开电脑桌上的“我的电脑”。2、然后在弹出来的窗口中点击打开“打开控制面板”。3、然后在弹出来的控制面板页面中选择打开“卸载程序”。4、然后在弹出来的窗口中点击打开“Go TOP应用程序”。5、之后鼠标右键单击该程序,选择“卸载”。6、重启电脑就解决而...
如何解决Windows10系统只读问题?
Windows 10系统只读问题可能有多种原因,解决方式也因此有所不同。以下是一些可能的解决方案:检查文件属性:如果文件被设置为只读属性,可以在文件属性中解除只读。右键点击该文件,选择“属性”,在属性窗口去掉“只读”选择框的勾选,然后点击“应用”。使用管理员权限修改:如果文件无法进行修改,可能是...
电脑上出现attempttowriteareadonlydatabase提示并且一直关不掉怎么办...
当电脑上出现“attempt to write a readonly database”提示且无法关闭时,可以尝试以下几个步骤来解决这个问题:1. **检查数据库文件权限**:首先确认数据库文件是否被设置为只读。在Windows系统中,可以右键点击数据库文件,选择“属性”,然后在“常规”标签页中检查“只读”属性是否被勾选。如果是,...