Устраните проблемы с сервером Linux с помощью этих 5 шагов по устранению неполадок
Если ваш сервер Linux не работает в полную силу, вероятно, существует основная проблема, которую необходимо решить.
Выполните эти пять простых, но практичных шагов, чтобы устранить неполадки сервера Linux и сократить время простоя до абсолютного минимума.
1. Проверьте оборудование.
Давайте перейдем к основам: проверьте оборудование. Это означает, что вы направляетесь к физической стойке и проверяете, не ослаблены ли какие-либо кабели или нет отключения электроэнергии.
Или введите следующую команду:
$ sudo ethtool eth0
Если он возвращает да, вы знаете, что ваш порт обменивается данными с сетью.
Чтобы проверить отчет об оборудовании BIOS / UEFI сервера, используйте следующую команду:
$ sudo dmidecode --type memory
Если ответ выглядит хорошо, проблема не в этом. Если вы подозреваете, что есть проблемы с памятью, выполните следующую команду:
$ sudo modprobe edac_core
Если после выполнения вышеупомянутой команды нет результатов, введите следующее:
$ sudo grep "[0-9]" /sys/devices/system/etc/mc/mc*/csrow*/ch*_ce_count
Это представляет вам список строк контроллера памяти вместе с количеством ошибок. Когда вывод объединяется с данными dmidecode в канале памяти, номере детали и слоте, вы можете успешно найти поврежденную карту памяти.
2. Расшифруйте точную проблему.
Ваш сервер вышел из строя, и нет двух вариантов решения этого вопроса. Прежде чем приступить к работе с инструментами, важно определить, в чем именно заключается проблема. Например, если ваши пользователи сталкиваются с проблемами с серверным приложением, вам необходимо убедиться, что проблема не на стороне клиента.
Во-вторых, в рамках поиска проблем вы должны попытаться сузить источник проблемы. Это будет означать либо сервер как таковой, либо серверное приложение. Например, серверная программа может выйти из строя, в то время как сервер функционирует как хорошо смазанная машина.
Чтобы проверить, нормально ли работает приложение, введите следующее:
$ sudo ps -ef | grep apache2
$ sudo netstat -plunt | grep apache2
Если сервер не отвечает, вы можете включить сервер Apache, используя:
$ sudo service apache2 start
Короче говоря, выясните точную проблему, прежде чем прыгать с пистолета. Это поможет сузить список проблем и поможет найти соответствующее решение.
3. Использование функции «Верх»
Top – одна из наиболее образцовых функций отладки Linux, поскольку она загружает среднее значение, подкачку и список процессов, использующих ресурсы системы.
Но при первом использовании это может показаться запутанным. Вот краткая разбивка топа.
Линия 1:
- Время
- Как долго компьютер работает?
- Количество пользователей
- Средняя нагрузка (время загрузки системы за последнюю минуту, последние 5 минут и последние 15 минут)
Строка 2:
- Общее количество задач
- Количество запущенных задач
- Количество спящих задач
- Количество остановленных задач
- Количество зомби-заданий
Строка 3:
- Использование ЦП в процентах пользователем
- Использование ЦП в процентах по системе
- Использование ЦП в процентах низкоприоритетными процессами
- Использование ЦП в процентах простаивающими процессами
- Использование ЦП в процентах от ожидания ввода-вывода
- Использование ЦП в процентах от аппаратных прерываний
- Использование ЦП в процентах от программных прерываний
- Использование ЦП в процентах от времени кражи
- Общая системная память
- Свободная память
- Используемая память
- Буферный кеш
Строка 4:
- Доступен общий своп
- Всего своп бесплатно
- Всего использовано своп
- Доступная память
За ним следует строка для каждого запущенного приложения. Это включает:
- ID процесса
- Пользователь
- Приоритет
- Хороший уровень
- Виртуальная память, используемая процессом
- Резидентная память, используемая процессом
- Совместно используемая память
- ЦП, используемый процессом в процентах
- Память, используемая процессом в процентах
- Временной процесс был запущен
- Командование
Чтобы узнать, какой процесс потребляет больше всего памяти , сначала отсортируйте процесс, набрав M.
Чтобы проверить процессы, использующие максимальную мощность ЦП, нажмите P.
Чтобы отфильтровать определенные параметры, нажмите O , после чего отобразятся следующие команды:
add filter #1 (ignoring case) as: [!]FLD?VAL
Кроме того, вы можете фильтровать конкретный процесс, например
COMMAND=apache
Это отфильтрует и покажет только процессы Apache.
4. Отслеживание дискового пространства.
Несмотря на бесконечное количество доступного хранилища, на сервере может не хватить места, что приводит к множеству проблем. В таких сценариях используйте команду df (дисковая файловая система), чтобы получить полную сводку доступного / использованного дискового пространства.
Вы можете использовать его тремя способами:
$ sudo df -h
$ sudo df -i
$ sudo df -hT
Еще одна полезная команда – % util , которая показывает, насколько загружено устройство. Любые значения, превышающие 60% использования, указывают на низкую производительность хранилища. Значение, близкое к 100%, означает, что диск близок к насыщению.
5. Проверьте журналы на наличие проблем.
Журналы содержат массу полезной информации в / var / log , подкаталоге, относящемся к службе. Для новичков журналы серверов Linux могут быть самым страшным местом на планете.
Это не обязательно, в основном потому, что журналы разделены по их функциональности. Один фиксирует, что происходит в системе / программе, а другой записывает сообщения об ошибках системы / приложения. Журналы обычно представляют собой огромные файлы, учитывая объем хранимой в них информации.
Файлы данных журнала загадочны, и всегда лучше научиться маневрировать.
Если вы не уверены, используйте dmesg , который отображает все сообщения ядра. По умолчанию хвостовая функция показывает первые 10 сообщений.
$ dmesg | tail
Комбинирование команды tail с ключевым словом -f продолжит следить за файлом системного журнала и распечатывать следующее событие в системном журнале.
$ dmesg | tail -f /var/log/syslog
Эта команда продолжит просмотр журналов и покажет возможные проблемы.
Эффективное устранение неполадок вашего Linux-сервера
Поиск и устранение неисправностей на вашем сервере Linux поначалу может показаться сложной задачей, но есть несколько примеров, необходимых, чтобы сдвинуть дело с мертвой точки. Если эти пять шагов не помогли вам выявить и отследить проблему, возможно, стоит привлечь других людей.
Однако в большинстве случаев один из описанных выше шагов по устранению неполадок должен помочь решить возникшую проблему.