Ошибка user.slice

После очередного переноса контейнеров возникала ошибка user.slice в логах контейнера.

Первый случай с Debian 9>>>
Второй случай с debian 10>>>


Система Debian 9, обновлено до 9.9.

Ошибка вида:

Jul 15 10:20:21 test systemd[901]: Failed to create /user.slice/user-1010.slice/user@1010.service/init.scope control group: Permission denied
Jul 15 10:20:21 test systemd[901]: Failed to allocate manager object: Permission denied

Я нашёл две команды, которые помогают решать проблему:

chmod o+rx /sys/fs/cgroup/systemd/
chmod o+rwx -R /sys/fs/cgroup/systemd/ 

Я воспользовался первой, но помогают обе. После перезагрузки контейнера эффект теряется, поэтому прописал команду в /etc/rc.local.

При возникновении этой ошибки в разных ОС, на форумах приводят содержание файлов типа: /lib/systemd/system/user.slice,
/lib/systemd/system/user@.service. Мне эти моменты не помогли.

Остаётся ещё ошибка в логах:

Failed to get udev device from devnum 9:124: No such device

По ней никакой информации узнать не получилось. Скорее всего по ней ничего нет, потому что проблем от этой ошибки тоже никаких нет (в моём случае, например). Копание привели меня на уровень выше к самой системе openvz, где работал контейнер, где в логах хост-системы я нашёл упоминание одно такого девайса 9:124

kernel: VE403: no allowed mount options found for device 9:124

, но с другим контекстом. В свою очередь это привело меня красиво на сайт виртуозы ?, где по логу вот такая информация:

Resolution
Such messages do not indicate any problems and can be ignored

Т.е. предлагает забить. Источник — https://virtuozzosupport.force.com/s/article/000014672


Второй случай с debian 10>>>

Аналогичный случай после обновления контейнера на OpenVZ с debian 8 на debian 10. Полный лог ошибки:

Oct 21 08:19:16 barman systemd[1]: Created slice User Slice of UID 110.
Oct 21 08:19:16 barman systemd[1]: Starting User Runtime Directory /run/user/110...
Oct 21 08:19:16 barman systemd[1]: Failed to get udev device from devnum 9:125: No such device
Oct 21 08:19:16 barman systemd[1]: Started User Runtime Directory /run/user/110.
Oct 21 08:19:16 barman systemd[1]: Starting User Manager for UID 110...
Oct 21 08:19:16 barman systemd[2762]: Failed to create /user.slice/user-110.slice/user@110.service/init.scope control group: Permis$
Oct 21 08:19:16 barman systemd[2762]: Failed to allocate manager object: Permission denied
Oct 21 08:19:16 barman systemd[1]: user@110.service: Failed with result 'protocol'.
Oct 21 08:19:16 barman systemd[1]: Failed to start User Manager for UID 110.
Oct 21 08:19:16 barman systemd[1]: Started Session 6280355 of user barman.
Oct 21 08:19:17 barman systemd[1]: session-6280355.scope: Succeeded.
Oct 21 08:19:17 barman systemd[1]: Stopping User Runtime Directory /run/user/110...
Oct 21 08:19:17 barman systemd[1]: Failed to get udev device from devnum 9:125: No such device
Oct 21 08:19:17 barman systemd[1]: run-user-110.mount: Succeeded.
Oct 21 08:19:17 barman systemd[1]: user-runtime-dir@110.service: Succeeded.
Oct 21 08:19:17 barman systemd[1]: Stopped User Runtime Directory /run/user/110.
Oct 21 08:19:17 barman systemd[1]: Removed slice User Slice of UID 110.

Применяю тот же тюниг, что описан в первой части статьи.

chmod o+rx /sys/fs/cgroup/systemd/
chmod o+rwx -R /sys/fs/cgroup/systemd/ 

Ошибки с user.slice ушли, и остались:

Failed to get udev device from devnum 9:125: No such device

Полный лог такой:

Oct 21 10:23:11 barman systemd[1]: session-6281474.scope: Succeeded.
Oct 21 10:23:21 barman systemd[1]: Stopping User Manager for UID 110...
Oct 21 10:23:21 barman systemd[7439]: Stopped target Default.
Oct 21 10:23:21 barman systemd[7439]: Stopped target Basic System.
Oct 21 10:23:21 barman systemd[7439]: Stopped target Paths.
Oct 21 10:23:21 barman systemd[7439]: Stopped target Timers.
Oct 21 10:23:21 barman systemd[7439]: Stopped target Sockets.
Oct 21 10:23:21 barman systemd[7439]: dirmngr.socket: Succeeded.
Oct 21 10:23:21 barman systemd[7439]: Closed GnuPG network certificate management daemon.
Oct 21 10:23:21 barman systemd[7439]: gpg-agent-browser.socket: Succeeded.
Oct 21 10:23:21 barman systemd[7439]: Closed GnuPG cryptographic agent and passphrase cache (acces$
Oct 21 10:23:21 barman systemd[7439]: gpg-agent.socket: Succeeded.
Oct 21 10:23:21 barman systemd[7439]: Closed GnuPG cryptographic agent and passphrase cache.
Oct 21 10:23:21 barman systemd[7439]: gpg-agent-ssh.socket: Succeeded.
Oct 21 10:23:21 barman systemd[7439]: Closed GnuPG cryptographic agent (ssh-agent emulation).
Oct 21 10:23:21 barman systemd[7439]: gpg-agent-extra.socket: Succeeded.
Oct 21 10:23:21 barman systemd[7439]: Closed GnuPG cryptographic agent and passphrase cache (restr$
Oct 21 10:23:21 barman systemd[7439]: Reached target Shutdown.
Oct 21 10:23:21 barman systemd[7439]: systemd-exit.service: Succeeded.
Oct 21 10:23:21 barman systemd[7439]: Started Exit the Session.
Oct 21 10:23:21 barman systemd[7439]: Reached target Exit the Session.
Oct 21 10:23:21 barman systemd[1]: user@110.service: Succeeded.
Oct 21 10:23:21 barman systemd[1]: Stopped User Manager for UID 110.
Oct 21 10:23:21 barman systemd[1]: Stopping User Runtime Directory /run/user/110...
Oct 21 10:23:21 barman systemd[1]: Failed to get udev device from devnum 9:125: No such device
Oct 21 10:23:21 barman systemd[1]: run-user-110.mount: Succeeded.
Oct 21 10:23:21 barman systemd[1]: user-runtime-dir@110.service: Succeeded.
Oct 21 10:23:21 barman systemd[1]: Stopped User Runtime Directory /run/user/110.
Oct 21 10:23:21 barman systemd[1]: Removed slice User Slice of UID 110.

Ошибку с devnum не решил, ниже просто конспекты для себя на будущее.

Логи для исследования на хосте с openvz:

/var/log/ploop.log

/var/log/vzctl.log

Я начал поиски проблемы с части лога контейнера:

Stopping User Runtime Directory /run/user/110…

Во-первых, это привело меня к тому, что проблема связана именно с виртуализацией, т.к. наткнулся почти сразу на аналогичный случай, где часть лога встречалась в контейнере, который был на OpenVZ.

Во-вторых, я начал плясать от каталога /run/user и нашёл занимательный момент. На моих других контейнерах дата изменения этого каталога была относительно старой и не менялась:

drwxr-xr-x 2 root root 40 Aug 10 2020 user

А на проблемной контейнере каталог постоянно обновлял свою дату изменения:

drwxr-xr-x 2 root root 40 Oct 21 13:50 user

Это происходило на вскидку 2-3 раза за 10 минут.

Правила в каталоге debian 10: /lib/udev/rules.d

Добавить комментарий