[Fli4l_dev] Problem mit Netzwerkkartentreiber (Mellanox)

Heinz-Peter Faasen fli.und.eis at web.de
Mo Aug 10 17:56:05 CEST 2020


Hallo Boris,


>>> Soweit so gut, es wird die Hardware erkannt.
>>>
>>> Allerdings wird keine IP-Adresse zugewiesen.
>>> Ich habe ien weiters Netzwerk in der base.txt eingefügt, es wird aber
>>> nicht berücksichtigt.
>>> IP_NET[6]='172.31.0.1/16'      #
>>> {
>>>     DEV='eth4'                   # required: device name like ethX
>>> #  MAC='00:02:c9:03:00:58'
>>> }

wolltest Du hier die Verknüpfung zur MAC herstellen? Dann musst Du das # 
entfernen.

> Ich fachte, wenn die Karte bei lspci auftaucht wird auch der Treiber 
> geladen?

Nein. Wenn die Karte erkannt wird, tauscht sie mit dem System Infos aus, 
die mit lspci angezeigt werden können. Das klappt auch, wenn gar kein 
Treiber auf dem System vorhanden ist.

Allerdings: Bei Dir taucht die Zeile

Kernel driver in use: mlx4_core

auf. Das bedeutet, dass der Treiber geladen wurde.
Infos über die geladenen Treiber liefert lsmod.

> Nachfolgend die Ausgabe von dmesg (reduziert auf die NIC's)
> 
> 
> e1000 0000:11:00.0 eth0: (PCI:33MHz:32-bit) 68:05:ca:93:16:ab
> e1000 0000:11:00.0 eth0: Intel(R) PRO/1000 Network Connection
> e1000 0000:11:01.0 eth1: (PCI:33MHz:32-bit) 00:0e:0c:82:99:ee
> e1000 0000:11:01.0 eth1: Intel(R) PRO/1000 Network Connection
> e1000e: Intel(R) PRO/1000 Network Driver - 3.2.6-k
> e1000e: Copyright(c) 1999 - 2015 Intel Corporation.
> e1000e 0000:00:19.0: Interrupt Throttling Rate (ints/sec) set to dynamic 
> conservative mode
> e1000e 0000:00:19.0 eth2: (PCI Express:2.5GT/s:Width x1) 00:21:86:ee:40:35
> e1000e 0000:00:19.0 eth2: Intel(R) PRO/1000 Network Connection
> e1000e 0000:00:19.0 eth2: MAC: 8, PHY: 8, PBA No: FFFFFF-0FF
> e1000e 0000:05:00.0: Interrupt Throttling Rate (ints/sec) set to dynamic 
> conservative mode
> e1000e 0000:05:00.0 0000:05:00.0 (uninitialized): registered PHC clock
> e1000e 0000:05:00.0 eth3: (PCI Express:2.5GT/s:Width x1) 68:05:ca:af:47:84
> e1000e 0000:05:00.0 eth3: Intel(R) PRO/1000 Network Connection
> e1000e 0000:05:00.0 eth3: MAC: 3, PHY: 8, PBA No: E46981-008
> mlx4_core: Mellanox ConnectX core driver v4.0-0
> mlx4_core: Initializing 0000:01:00.0
> mlx4_core 0000:01:00.0: 16.000 Gb/s available PCIe bandwidth, limited by 
> 2.5 GT/s x8 link at 0000:00:01.0 (capable of 32.000 Gb/s with 5 GT/s x8 
> link)
> 8021q: 802.1Q VLAN Support v1.8
> 8021q: adding VLAN 0 to HW filter on device eth1
> 8021q: adding VLAN 0 to HW filter on device eth0
> e1000: eth1 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: RX/TX
> e1000: eth0 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: RX
> e1000e: eth2 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: Rx/Tx
> 
> 
> 
>>> Was könnte ich hier noch falsch gemacht haben?
>>> Warum wird der Netzwerkkarte keine Schnittstellennummer zugeteilt?

Es fehlt ja auch eth3. C&P-Fehler?


> Ich hänge noch die Ausgabe von ip address an (gekürzt)
> 
> fli4l 4.0.0-r58678-testing # ip address
> 1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN 
> group default qlen 1000
>      link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
>      inet 127.0.0.1/8 scope host lo
>         valid_lft forever preferred_lft forever
> 
> 2: eth0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast 
> state UP group default qlen 1000
>      link/ether 68:05:ca:93:16:ab brd ff:ff:ff:ff:ff:ff
> 
> 3: eth1: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast 
> state UP group default qlen 1000
>      link/ether 00:0e:0c:82:99:ee brd ff:ff:ff:ff:ff:ff
>      inet 192.168.1.2/30 brd 192.168.1.3 scope global eth1
>         valid_lft forever preferred_lft forever
> 
> 4: eth2: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast 
> state UP group default qlen 1000
>      link/ether 00:21:86:ee:40:35 brd ff:ff:ff:ff:ff:ff
>      inet 172.29.0.1/16 brd 172.29.255.255 scope global eth2
>         valid_lft forever preferred_lft forever
> 
> 5: eth3: <BROADCAST,MULTICAST> mtu 1500 qdisc noop state DOWN group 
> default qlen 1000
>      link/ether 68:05:ca:af:47:84 brd ff:ff:ff:ff:ff:ff
> 
> 6: eth1.7 at eth1: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc noqueue 
> state UP group default qlen 1000
>      link/ether 00:40:63:da:cf:33 brd ff:ff:ff:ff:ff:ff
> 
> 7: eth0.3 at eth0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc noqueue 
> state UP group default qlen 1000
>      link/ether 68:05:ca:93:16:ab brd ff:ff:ff:ff:ff:ff
>      inet 172.16.0.1/16 brd 172.16.255.255 scope global eth0.3
>         valid_lft forever preferred_lft forever
> 
> 8: eth0.5 at eth0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc noqueue 
> state UP group default qlen 1000
>      link/ether 68:05:ca:93:16:ab brd ff:ff:ff:ff:ff:ff
>      inet 172.27.0.1/16 brd 172.27.255.255 scope global eth0.5
>         valid_lft forever preferred_lft forever
> 
> 9: imq0: <NOARP,UP,LOWER_UP> mtu 16000 qdisc htb state UNKNOWN group 
> default qlen 11000
>      link/void
> 
> 
> 
> 
> Und der Vollständigkeit halber einen Auszug aus der base.txt:
> Viellicht ist da ja ein Bock drin, den ich aus Blindheitsgründen nicht 
> sehe.
> 
> NET_DRV[]='e1000'
> {
>    OPTION=''
> }
> NET_DRV[]='e1000e'
> {
>    OPTION=''
> }
> NET_DRV[]='mlx4_core'
> {
>    OPTION=''
> }
> 
> 
>   sowie
> 
> IP_NET[1]='172.16.0.1/16'
> {
>    DEV='eth0.3'
>    COMMENT='normalesNetz'
>    MAC='68:05:ca:93:16:ab'
> }
> 
> IP_NET[5]='172.27.0.1/16'
> {
>    DEV='eth0.5'
>    COMMENT='Gaestenetz1'
>    MAC='68:05:ca:93:16:ab'
> }
> 
>   IP_NET[2]='172.29.0.1/16'
>   {
>    DEV='eth2'
>    COMMENT='Gaestenetz2'
>    MAC='00:21:86:ee:40:35'
>   }
> 
> IP_NET[3]='{VDSL}'
> {
>    DEV='eth1.7'
>    MAC='00:40:63:da:cf:33'
> }
> 
> IP_NET[4]='192.168.1.2/30'    # für den Zugriff auf das DSL-Modem
>                                # /30 maskiert *.1.0, *.1.1, *.1.2, *.1.3
> {
>    DEV='eth1'
>    MAC='00:0e:0c:82:99:ee'
> }
> 
> 
> IP_NET[6]='172.31.0.1/16'  # Das sollte die Mellanox-Karte sein...
> {
>    DEV='eth4'
> #  MAC='00:02:c9:03:00:58'
> }

Ok, ich sehe gerade, dass eth3 gar nicht definiert ist. ;)
Das Gatter bei der MAC würde ich trotzdem entfernen.

Versuche doch mal, eth4 manuell zu starten. Welche Ausgaben erhälst Du dann?

> Falls jemand bis hier hin gelesen hat: Vielen Dank dafür.

Abwarten, ob wir dem Problem auf den Grund kommen können. ;)

Gruß
Heinz-Peter



Mehr Informationen über die Mailingliste Fli4l_dev