トラブルから学ぶ!Mac×無線LAN問題解決までの取り組み
はじめに
はじめまして。リクルートICT統括室の多田です。
2022年にリクルートに入社後、主にリクルート従業員が利用する社内ネットワーク担当をしています。今回はMacユーザーがオフィスの無線LANを利用した際に起きたトラブルと実施した無線改善施策について紹介します。
何が起きたのか?
リクルートでは社内利用できる端末としてWindowsとMacが選べます。
今回のトラブルは主にMacユーザーで起きたトラブルです。社内の施策の一環で新しくAppleシリコン搭載のMac(以下、新Mac)へ入れ替えを進めた結果、新Macユーザーが増加するにつれて無線LANに関する下記トラブルの申告が増えてきました。
発生したトラブル
1 |
通信速度が遅い、遅くなる |
利用中、ブラウジングやオンラインサーバーのファイル動作が遅くなる |
2 |
移動後に通信が遅くなる |
オフィス内の移動後に通信が遅くなる |
3 |
通信が切れる |
無線が数秒くらい接続断となる。切れる→つながる動作を繰り返す |
4 |
SSIDが消える(表示されなくなる) |
WiFiの接続先候補からSSIDが消える |
これらのトラブルに対して調査、改善策を適用、事象の再現性を確認するというサイクルを回し少しずつ解決に向けて対応を進めて行きました。
トラブル調査の始め
調査を始めた当初は無線LANで問題が発生していると考え、無線ログなどをベースに調査を進めていました。しかし、無線ログだけでは正常な状態に見えていて実際に何が起きたのか特定することが難しく解決までに時間を要していました。
そんな中、ユーザー申告から新Macユーザーが多いフロアでの発生傾向が見えてきたためMac固有の問題の可能性も視野に入れ、無線とMacの双方の情報を元に調査を開始。そうすることで少しずつ解決の糸口が見え始めてきました。
トラブル解決に向けて
前述した4つのトラブルに対して、無線と端末それぞれから解析を行うことで見えてきた原因と実施策について説明したいと思います
1.通信速度が遅い、遅くなる
無線LANを利用中、ブラウジングが遅くなる、オンラインサーバーのファイル動作が重いなどの事象です。これらは無線LAN利用者が多い状況での無線APのスペック不足と無線空間の混雑率の高さ、そしてmacOSの不具合が原因で引き起こされていました。
a.取り組んだこと
- スケールアップしたAPで802.11ax(WiFi6)へ対応
混雑時にAPでCPUの高騰などがみられたため、上位機種へのリプレースと802.11ax導入によって改善をはかりました。交換した結果、通常時は802.11acと比べて平均10~20Mbpsくらい早くなりスループットの改善が確認できています。
- 不要パケット削減で無線空間のクリーン化
リクルートの無線環境は接続端末が多いためか通信に不要なパケット(主にIPv6ブロードキャスト、マルチキャスト)が多く流れていました。
これらパケットは端末からデフォルトで送信されるものです。
本パケット1つ1つは大した通信量ではありませんが最大600端末が接続するフロアもあり、総トラフィックの影響も考慮しAPのフィルタリングを使用してトラフィック削減を行いました。
- 最新OSへのバージョンアップで不具合改修
Macのログを解析した結果、WiFiドライバがクラッシュするOS不具合が判明したため改修OSのSonomaへのVersionUPを推進していきました。
これは対応策の中で一番効果があった改善策でした。OS最新化が進むにつれて申告数も減少していきました。
2.移動後、通信が遅くなる
ユーザーがオフィス内で移動を行った時に通信が遅くなる場合がありました。オフィスはフリーアドレスなので会議などでオフィス内の移動が発生するユーザーがいます。この事象はMacのローミングの仕様上、移動後の席から遠くのAPに接続された状態を維持してしまうことが通信速度の低下を引き起こしていました。
リクルートのオフィスは遮蔽物が少なく比較的、電波が届きやすいことに加えてAP数も多い高密度な環境です。そのため自身の席から遠い場所にあるAPでもMacのローミングの基準値である-75dBmを下回る受信強度にならず接続を維持してしまうことが起きていました。Macの仕様を考慮してより受信強度が高いAPにMacを接続させるために2つの設定を行っています。
a.取り組んだこと
- APの電波出力強度を調整
AP1台あたりの電波出力強度を調整してカバーするエリアを小さくするチューニングを行いました。
カバーエリアをチューニングすることで、Macからみて遠いAPが出力する電波強度が低くなり、ローミングしやすい環境が実現できました。
改善後は基本-60dBm以上のAPに接続されるようになりました。
- Macのローミング推奨設定の導入
Macの仕様に合わせてMac推奨パラメーターである802.11k/v/rを有効化しよりスムーズなローミングが行われるよう改善を実施しました。
802.11k |
端末に周辺APの情報を提供する |
802.11v |
端末にローミングに最適な接続候補の周辺のAP情報を提供 |
802.11r |
AP間で鍵情報(PSK)を配布し認証を簡略化。高速ローミングをサポート |
3.通信が切れる
一時的に無線が切れてしまったり、切断→接続の動作を繰り返す状態になってしまう事象です。
これはDFSの誤検知と2.4Ghzと5Ghz間で切断→接続を繰り返すフラッピングが原因で発生していました。
a.取り組んだこと
- OS改修でDFSの誤検知改善
1.通信速度が遅い、遅くなる事象への対策として導入したAPでDFSの誤検知が多く発生していました。
VersionUP前後でDFSの検知数は減少しましたが、5Ghzを利用する限り影響をゼロにはできないためWiFi6E以降への対応も検討しています。 - 2.4Ghz帯の停波で接続フラッピングを防止
Macの接続ログを解析したところ同一APの2.4GhzのBSSIDと5GhzのBSSID間で接続を繰り返している動作が確認できました。
なぜこのような動作を起こすのか根本原因はわかりませんでしたが、前述の通り比較的電波が通り易いオフィスでかつAPも高密度に設置されているため2.4Ghz帯の停波を行い、再発しないよう改善を行いました。
4.SSIDが消える(表示されなくなる)
MacのWiFiの接続先候補からSSIDが消える事象が発生していました。
これはSSIDがステルスモードであること、かつMacのBlackList機能により発生した事象でした。
BlackListとはSSIDが低品質と判定した際にMac側で接続できないようWiFi接続の候補から消してしまう機能です。
一度BlackListに登録されると再起動もしくは手動でSSIDプロファイルの作成が必要のため発生ユーザーでのリカバリー負荷が高いことも問題でした。
a.取り組んだこと
- SSIDの非ステルス化で不具合回避
リクルートの無線LANはSSIDをステルス化していましたがMac側で非ステルスSSIDと誤認してしまうことがあり、その不具合が起きた結果SSIDが消える事象を起こしていました。Mac推奨設定であるSSIDの非ステルス化を行ったところ、本事象の申告がなくなり改善がみられました。
- 最新OSへのVersionUPでBlackList回避
なぜ低品質と判断されてBlackListに登録されてしまうのか根本原因の追求はできていません。しかし”1.通信速度が遅い、遅くなる”の対策の1つであるOS最新化を行ったところBlackListに登録される事象の再現性はなくなりました。
以上がトラブル発生から解決を目指して取り組んだことです。最初の申告から全てを解決するまでは半年くらいの時間がかかりましたが、無線LANと端末2つの観点から調査を進めることで事象への対応策の確度やスピードも上がり、当初よりは大幅な改善ができたと感じています。
今回のトラブルを振り返ってみて
トラブルを振り返ると、無線LANの問題解決にはネットワークと端末の両方を考慮したアプローチが重要であることが実感できました。特に端末のOSやドライバーの最新化は効果的です。
今回のトラブルはMacの変化がトリガーとなったことから自身の担当範囲であるネットワークエリアだけでなく、ワークスタイルや業務の変化に合わせた改善サイクルを検討することの重要性も再認識できました。この経験を通じて、引き続き、無線環境の最適化に努めていきたいと思います。
最後に
様々な対策を打ったことで多くのユーザーの業務がとまる最悪の事態は回避できた一方、ユーザーの無線LANに対する不満の声は以前として残っており、まだまだ改善の余地があると感じています。これからも改善対応は継続してまいりますが、本内容が無線LANの問題に対応している管理者・担当者向けの解決の糸口になれれば幸いです。
このブログを読んでピンと来た方は、ぜひ一度採用サイトもご覧いただけるとうれしいです。まずはカジュアル面談から、という方も大歓迎です。
また、他にも色々な記事を投稿していきます!
過去の記事もご興味あれば、ぜひ他の記事もあわせてご参照ください。
・Recruit Tech Blog
・リクルート ICT統括室 Advent Calendar 2024
・リクルート ICT統括室 Advent Calendar 2023