Jump to content
  • 0

3.07.B.3.0-0 Keenetic Peak наглухо зависает уже второй раз за месяц. Помогает только выключение питания.


Andrew Voronkov
 Share

Question

Добрый день. Уже несколько месяцев являюсь обладателем роутера Keenetic Peak. За последний месяц роутер дважды завис так, что восстановить работоспособность получалось только выдергиванием блока питания из сети. До этого ждал минут 10, пытался подключиться по telnet и тд - всё безрезультатно. Тикет в поддержке #560431 - но сотрудник считает, что это нормальное поведение роутера и виновата моя сеть(!?!?).

Другой сотрудник Кинетика мне сообщил, что в бета2 были допилены вотчдоги. Не очень помню хронологию, но на бета1 вроде Peak ни разу не зависал у меня, началось с бета2 и продолжается на бета3.

В FAQ Кинетика по поводу вотчдогов написано, что роутер невозможно ввести в состояние полного зависания и если такое случилось, то проблема 100% с железом роутера. Почему тогда мне пытаются внушить, что проблема с моей сетью - не очень понятно.


Выглядит зависание так. Неожиданно пропадает интернет. Проводные клиенты пишут "без доступа к сети интернет". При переподключении появляется Неопознанная сеть. Беспроводные тоже без интернета, но при отключении-подключении они получают ip без проблем, но доступа к сети нет.
Пинг по беспроводной сети идёт, по проводной - не находит узел. Телнет доступа нет ни в одном варианте.
Индикация на самом роутере - светодиод питания горит, беспроводной - мигает как обычно. Диод, отвечающий за интернет - не горит. Вебморда недоступна.
После перезагрузки по питанию - всё начинает работать как обычно.
ultra2 ровно на месте этого роутера и в той же сети (с той же конфигурацией (она портирована саппортом Кинетика), а сама сеть не менялась уже год) работала без проблем годами - а Peak виснет наглухо уже второй раз за месяц.

Не знаю, связано ли это как-то, но в журнале время от времени стали появляться красные строчки, раньше их точно не было никогда:

nf_conntrack: unable to save third interface 20, already has 24 and 8 (protonum 17)

Селфтест и конфиг есть в саппорте, скрытыми выложил селфтест и лог сюда. 

На данный момент мне посоветовали в саппорте выполнить no interface GigabitEthernet0 flowcontrol и ждать, когда роутер зависнет в следующий раз, после чего отключать по одному проводные клиенты в надежде, что он оживёт. Если это не поможет, то роутер под замену. Вот только не факт, что я в момент следующего зависания окажусь рядом - то есть сначала сеть в загородном доме на 60-70 клиентов (камеры, охрана, умный дом, сервер и тд) полностью упадёт по вине роутера за 16 тысяч, а мне потом нужно к ней быстро ехать, диагностировать и восстанавливать. Так себе приключение.

Не очень вяжется эта рекомендация с официальной позицией Кинетика, что ввести его в полное зависание невозможно... Буду рад любым рекомендациям. Почему-то саппорт Кинетика даже совершенно не жаждет мои селфтесты, сконцентрировавшись на выводе, что роутер виснет наглухо из-за моей сети. 

Edited by Andrew Voronkov
  • Upvote 1
Link to comment
Share on other sites

16 answers to this question

Recommended Posts

  • 0
5 минут назад, Andrew Voronkov сказал:

Добрый день. Уже несколько месяцев являюсь обладателем роутера Keenetic Peak. За последний месяц роутер дважды завис так, что восстановить работоспособность получалось только выдергиванием блока питания из сети. До этого ждал минут 10, пытался подключиться по telnet и тд - всё безрезультатно. Тикет в поддержке #560431 - но сотрудник считает, что это нормальное поведение роутера и виновата моя сеть(!?!?).

Другой сотрудник Кинетика мне сообщил, что в бета2 были допилены вотчдоги. Не очень помню хронологию, но на бета1 вроде Peak ни разу не зависал у меня, началось с бета2 и продолжается на бета3.

В FAQ Кинетика по поводу вотчдогов написано, что роутер невозможно ввести в состояние полного зависания и если такое случилось, то проблема 100% с железом роутера. Почему тогда мне пытаются внушить, что проблема с моей сетью - не очень понятно.


Выглядит зависание так. Неожиданно пропадает интернет. Проводные клиенты пишут "без доступа к сети интернет". При переподключении появляется Неопознанная сеть. Беспроводные тоже без интернета, но при отключении-подключении они получают ip без проблем, но доступа к сети нет.
Пинг по беспроводной сети идёт, по проводной - не находит узел. Телнет доступа нет ни в одном варианте.
Индикация на самом роутере - светодиод питания горит, беспроводной - мигает как обычно. Диод, отвечающий за интернет - не горит. Вебморда недоступна.
После перезагрузки по питанию - всё начинает работать как обычно.
ultra2 ровно на месте этого роутера и в той же сети (с той же конфигурацией (она портирована саппортом Кинетика), а сама сеть не менялась уже год) работала без проблем годами - а Peak виснет наглухо уже второй раз за месяц.

Не знаю, связано ли это как-то, но в журнале время от времени стали появляться красные строчки, раньше их точно не было никогда:

nf_conntrack: unable to save third interface 20, already has 24 and 8 (protonum 17)

Селфтест и конфиг есть в саппорте, если надо - прикреплю свежие. 

На данный момент мне посоветовали в саппорте выполнить no interface GigabitEthernet0 flowcontrol и ждать, когда роутер зависнет в следующий раз, после чего отключать по одному проводные клиенты в надежде, что он оживёт. Если это не поможет, то роутер под замену. Вот только не факт, что я в момент следующего зависания окажусь рядом - то есть сначала сеть в загородном доме на 60-70 клиентов (камеры, охрана, умный дом, сервер и тд) полностью упадёт по вине роутера за 16 тысяч, а мне потом нужно к ней быстро ехать, диагностировать и восстанавливать. Так себе приключение.

Не очень вяжется эта рекомендация с официальной позицией Кинетика, что ввести его в полное зависание невозможно... Буду рад любым рекомендациям. Почему-то саппорт Кинетика даже совершенно не жаждет мои селфтесты, сконцентрировавшись на выводе, что роутер виснет наглухо из-за моей сети. 

Обратитесь в официальную поддержку.

Link to comment
Share on other sites

  • 0
Только что, Илья Картавенко сказал:

В сообщении выше указан даже номер моего обращения в поддержку, по которому уже вторую неделю меня убеждают, что виновата моя сеть, а Кинетик так и должен зависать наглухо. 

  • Upvote 1
Link to comment
Share on other sites

  • 0
1 минуту назад, Andrew Voronkov сказал:

В сообщении выше указан даже номер моего обращения в поддержку, по которому уже вторую неделю меня убеждают, что виновата моя сеть, а Кинетик так и должен зависать наглухо. 

Так сам по себе он и не будет зависать, его явно что то кладет. Пользовались другими кинетиками? Пробуйте отключать и проводные и беспроводные клиенты по одному.

Link to comment
Share on other sites

  • 0
Только что, Илья Картавенко сказал:

Пользовались другими кинетиками?

Скажите, а вы сначала отвечаете, а потом читаете? Кроме того, у меня в профиле указаны с десяток кинетиков.

Опять же, в исходном посте указано: на месте пика пять лет стояла ультра2. За последний год сеть не менялась. Конфиг с ультры на пик портировали сотрудники кинетика. Н ультре не было ни разу такого за все годы. 

2 минуты назад, Илья Картавенко сказал:

его явно что то кладет

Если верить FAQ Кинетика (статья "Что такое Watchdog и как он работает в Keenetic") - в природе не существует случая, когда исправный роутер может зависнуть наглухо. И я склонен верить FAQ'у - из любой даже самой критической ситуации роутер должен вытягиваться вотчдогом. Я даже согласен на принудительный ребут как крайний случай - но не полное зависание.

4 минуты назад, Илья Картавенко сказал:

Пробуйте отключать и проводные и беспроводные клиенты по одному.

Что-то мне кажется мне с моими 60-80 клиентами на это придется потратить ни один месяц. Проще вернуться на ультру2. 

 

П.С. Вот выдержка из статьи:

Так что с уверенностью можно сказать, что если если вам каким-то чудом удалось ввести Кинетик в такое состояние, что ядро перестало успевать сбрасывать счетчик сторожевого таймера (а это также означает, что Кинетик перестал успевать выполнять свои первоочередные задачи), то он сам выйдет из этого состояния перезагрузкой (временной интервал составляет не более 15 секунд от зависания до перезагрузки). А если вы обнаружили Кинетик полностью повисшим, и не реагирующим ни на что, кроме отключения питания, то увы, но мы скорее склонны подозревать, что он сломан аппаратно.

  • Upvote 1
Link to comment
Share on other sites

  • 0
10 минут назад, Andrew Voronkov сказал:

Скажите, а вы сначала отвечаете, а потом читаете? Кроме того, у меня в профиле указаны с десяток кинетиков.

Опять же, в исходном посте указано: на месте пика пять лет стояла ультра2. За последний год сеть не менялась. Конфиг с ультры на пик портировали сотрудники кинетика. Н ультре не было ни разу такого за все годы. 

Если верить FAQ Кинетика (статья "Что такое Watchdog и как он работает в Keenetic") - в природе не существует случая, когда исправный роутер может зависнуть наглухо. И я склонен верить FAQ'у - из любой даже самой критической ситуации роутер должен вытягиваться вотчдогом. Я даже согласен на принудительный ребут как крайний случай - но не полное зависание.

Что-то мне кажется мне с моими 60-80 клиентами на это придется потратить ни один месяц. Проще вернуться на ультру2. 

 

П.С. Вот выдержка из статьи:

Так что с уверенностью можно сказать, что если если вам каким-то чудом удалось ввести Кинетик в такое состояние, что ядро перестало успевать сбрасывать счетчик сторожевого таймера (а это также означает, что Кинетик перестал успевать выполнять свои первоочередные задачи), то он сам выйдет из этого состояния перезагрузкой (временной интервал составляет не более 15 секунд от зависания до перезагрузки). А если вы обнаружили Кинетик полностью повисшим, и не реагирующим ни на что, кроме отключения питания, то увы, но мы скорее склонны подозревать, что он сломан аппаратно.

А потом, у вас стоит бета версия прошивки, перейдите на 3.6.10 стабильную. Зачем сидеть на бете, если у вас такая серьезная инфраструктура с видеонаблюдением

Link to comment
Share on other sites

  • 0
2 часа назад, Илья Картавенко сказал:

А потом, у вас стоит бета версия прошивки, перейдите на 3.6.10 стабильную

Я полностью согласен. Это первое, что мне пришло в голову. Вот если такая ситуация проявляется на стабильной версии, тогда и нужно шум поднимать. А по поводу беты и альфы так и сказано, что возможна нестабильная работа.

Link to comment
Share on other sites

  • 0
2 часа назад, Andrew Voronkov сказал:

И я склонен верить FAQ'у - из любой даже самой критической ситуации роутер должен вытягиваться вотчдогом.

Сторож сработает только если "повиснет" ядро. У Вас же проблема в чем-то другом. Ядро продолжает работать, беспроводные клиенты продолжают работать. Нет причин для сработки сторожа. Ядро продолжает его сбрасывать. Думою если подключить терминал к UART там будет работать cli. Ядру не приходят пакеты по проводным интерфейсам - это проблема где-то в модулях ядра. Например я встречаю подобную ситуацию на прошивке Падавана rt-n56u при сборке компилятором gcc-8.5. При сборке на gcc-7.5 и ниже проблема не проявляется. Так и не разобрался, не хватает скилла) Может притянуто за уши, но со стороны выглядит похоже.

Link to comment
Share on other sites

  • 0
12 минуты назад, Legoos сказал:

Сторож сработает только если "повиснет" ядро. У Вас же проблема в чем-то другом. Ядро продолжает работать, беспроводные клиенты продолжают работать. Нет причин для сработки сторожа. Ядро продолжает его сбрасывать. Думою если подключить терминал к UART там будет работать cli. Ядру не приходят пакеты по проводным интерфейсам - это проблема где-то в модулях ядра. Например я встречаю подобную ситуацию на прошивке Падавана rt-n56u при сборке компилятором gcc-8.5. При сборке на gcc-7.5 и ниже проблема не проявляется. Так и не разобрался, не хватает скилла) Может притянуто за уши, но со стороны выглядит похоже.

У него прошивка родная, не кастомная

Link to comment
Share on other sites

  • 0
16 минут назад, Rodstvennik63 сказал:

Вот если такая ситуация проявляется на стабильной версии, тогда и нужно шум поднимать.

Мы как раз в теме форума для такого "шума", а правильно он называется багрепорт.

16 минут назад, Rodstvennik63 сказал:

А по поводу беты и альфы так и сказано, что возможна нестабильная работа.

Я не бете, которая относительно скоро пойдёт в релиз. Если проблему не локализовать в бете, она раскатается на все Пики.

15 минут назад, Legoos сказал:

беспроводные клиенты продолжают работать.

Чуть уточню. Они не совсем продолжают работать, они подключаются, получают ip, но без доступа к интернету и даже к локальной сети.

15 минут назад, Legoos сказал:

Нет причин для сработки сторожа.

Я полагаю, в кинетике далеко не один сторож - и вариантов их взаимодействия помимо перезагрузки роутера - великое множество, в том числе передергивать определенный интерфейс, который подвис. Но этого не происходит. 

А при наличии у меня двух резервных каналов (второй проводной и wisp) - при пропадании доступа в интернет кинетик в момент зависания никуда не переключается. Возможно, это тоже косвенно говорит о том, какой модуль зависает.

15 минут назад, Legoos сказал:

Ядру не приходят пакеты по проводным интерфейсам - это проблема где-то в модулях ядра.

Вот поэтому мне вдвойне странно, что саппорт не возбудился на такую проблему.. 

 

Edited by Andrew Voronkov
  • Upvote 1
Link to comment
Share on other sites

  • 0
19 минут назад, Andrew Voronkov сказал:

Чуть уточню. Они не совсем продолжают работать, они подключаются, получают ip, но без доступа к интернету и даже к локальной сети.

А у меня они подключаются, проходят аутентификацию, но arp пакеты уже не ходят dhcp не работает. Видимо как то встаёт и бридж. Но если зайти в консоли и сделать down, а потом up интерфейсу процессора, который идёт на свитч, то все оживает. Как будто забивается очередь какая-то. Поэтому Вам и советовали в ТП выключить flow control, предполагали, что оно криво работает с каким-то Вашим или провайдеровским оборудованием. У меня это проявляется на процессоре MT7621 со встроенным свитчём. На пике другой процессор 7622 на другом ядре и внешний свитч. Процессор другой, но возможно ядро ethernet похоже. В любом случае для разработчиков этот процессор нов и подобные проблемы это нормальное явление. То, что ТП не уделяет должного внимания - это просто предвзятое отношение, они предполагают наиболее вероятные проблемы и предлогами решение. Вы правильно сделали, что написали сюда. Разработчики совершенно адекватные и обязательно прислушаться.

  • Thanks 1
Link to comment
Share on other sites

  • 0
3 часа назад, Legoos сказал:

 что оно криво работает с каким-то Вашим или провайдеровским оборудованием. У меня это проявляется на процессоре MT7621 со встроенным свитчём. На пике другой процессор 7622 на другом ядре и внешний свитч.

В Peak думаю такой же свитч (10 x 1 Гбит/с: 9 x  RJ-45, 1 x SFP ) как и в KN2610 (9 x 1 Гбит/с: 8 x  RJ-45, 1 x Combo RJ-45/SFP) оличие  в подключение SFP

Скрытый текст
[I] Jan  1 03:00:07 kernel: mt7622_eth: NDM Ethernet Switch Driver for MediaTek MT7622, v1.1.2
[I] Jan  1 03:00:07 kernel: mt7622_eth: MT7622 SoC, TX/RX descriptors: 2048/1024, NAPI weight 64, LRO, DMA hw-coherent
[I] Jan  1 03:00:07 kernel: mt7622_eth: eth2 created for GMAC1 (хх:хх:хх:хх:хх:0d address, 8 EPHY ports)
[I] Jan  1 03:00:07 kernel: mt7622_eth: eth3 created for GMAC2 (хх:хх:хх:хх:хх:0e address, 1 EPHY port)
[I] Jan  1 03:00:07 kernel: mt7622_eth: RTL8370MB switch, ID: 6368, Ver: 0010
[I] Jan  1 03:00:07 kernel: mt7622_eth: RTL8370MB switch configured with SGMII-2.5G
[I] Jan  1 03:00:07 kernel: mt7622_eth: RTL8370MB switch initialized

[I] Sep 25 17:24:29 ndm: Network::Interface::Mac: "GigabitEthernet0/Vlan2": MAC address reset to хх:хх:хх:хх:хх:0e.

[I] Sep 25 17:24:30 ndm: Network::Interface::Mac: "GigabitEthernet1": MAC address reset to хх:хх:хх:хх:хх:0e.


interface GigabitEthernet0/0
    rename 1
interface GigabitEthernet0/1
    rename 2
interface GigabitEthernet0/2
    rename 3
interface GigabitEthernet0/4
    rename 5
interface GigabitEthernet0/5
    rename 6
interface GigabitEthernet0/6
    rename 7
interface GigabitEthernet0/7
    rename 8
    switchport access vlan 1

interface GigabitEthernet0/8
    rename SFP
    role inet for GigabitEthernet0/Vlan2
    switchport mode access
    switchport access vlan 2

interface Bridge0
    inherit GigabitEthernet0/Vlan1
    include AccessPoint
    include AccessPoint_5G

interface GigabitEthernet1
    rename ISP
    mac address factory wan

Selftest KN2610 не видел, тут в данном случае выше SFP нет только провод на WAN подключен

Опять же исходя только из догадок и того что выше

Цитата

Неожиданно пропадает интернет. Проводные клиенты пишут "без доступа к сети интернет". При переподключении появляется Неопознанная сеть. Беспроводные тоже без интернета, но при отключении-подключении они получают ip без проблем, но доступа к сети нет.
Пинг по беспроводной сети идёт, по проводной - не находит узел. Телнет доступа нет ни в одном варианте.

Они не совсем продолжают работать, они подключаются, получают ip, но без доступа к интернету и даже к локальной сети.

А при наличии у меня двух резервных каналов (второй проводной и wisp)

думаю тут основное подключение по оптике (SFP) тогда возможно бзик свитча.

Edited by vasek00
  • Thanks 1
Link to comment
Share on other sites

  • 0
1 минуту назад, vasek00 сказал:

думаю тут основное подключение по оптике (SFP) тогда возможно бзик свитча.

Нет, у меня основное подключение - витая пара, резерв тоже витая пара, второй резерв wisp. Sfp вообще не использую. 

Link to comment
Share on other sites

  • 0
1 минуту назад, Andrew Voronkov сказал:

Нет, у меня основное подключение - витая пара, резерв тоже витая пара, второй резерв wisp. Sfp вообще не использую. 

Ну что ж отпадает догадка.

  • Thanks 1
Link to comment
Share on other sites

  • 0
21 час назад, Илья Картавенко сказал:

Так сам по себе он и не будет зависать, его явно что то кладет. Пользовались другими кинетиками? Пробуйте отключать и проводные и беспроводные клиенты по одному.

И поледние слова закончились.

Link to comment
Share on other sites

  • 0
23 часа назад, Andrew Voronkov сказал:

nf_conntrack: unable to save third interface 20, already has 24 and 8 (protonum 17)

В selftet есть раздел "<file name="proc:driver/nacct/stats">" и чуток по ниже "<file name="proc:driver/hwnatacct/stats">" можно найти номера интерфейсов ifindex этот к чему у вас относиться

  • Thanks 1
Link to comment
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Answer this question...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

 Share

  • Recently Browsing   0 members

    • No registered users viewing this page.
×
×
  • Create New...