1. CoWoS — チップを「くっつける」革命
GPUとHBMは別々のシリコン。これを超高密度に接続するのが先進パッケージング。普通の基板(マザーボード)では配線が太すぎて、HBMに必要な1024bitのバス幅(数千本の接続)を確保できない。
CoWoS(Chip on Wafer on Substrate)
TSMCが開発した先進パッケージング技術。チップとマザーボードの間にシリコンインターポーザ(超微細配線が入ったシリコン板)を挟む。
シリコン製だから半導体と同じ微細配線が可能
配線ピッチ: 基板の100倍以上細かい
味の素が絶縁フィルムを独占供給
なぜCoWoSがボトルネックか
インターポーザはGPU + HBM 4〜8個を全部載せる巨大なシリコン板。
大きい = ウェハから取れる数が少ない + 欠陥に当たる確率が高い = 歩留まりが悪い。
NVIDIAがGPUをいくら設計しても、TSMCのCoWoS生産能力が足りなければサーバーは作れない。
📚 より詳しく
- Wikipedia: CoWoS — TSMCの先進パッケージング技術の概要
- YouTube: CoWoS packaging — 3Dアニメーションで見るCoWoSの構造
2. パッケージングの2つの方向
GPU + HBMをインターポーザ上に横並び
担当: TSMC
課題: インターポーザが巨大 → 歩留まり
DRAMチップをシリコン貫通電極で積層 = HBM
担当: SK Hynix、Samsung
課題: 歩留まり = 0.95n層
💡 ロジック vs メモリ — 業界構造が全く違う
Lesson 1で学んだ「設計と製造の分離」はロジック半導体の話。メモリは違う。
| ロジック(CPU/GPU) | メモリ(DRAM/NAND) | |
|---|---|---|
| 構造 | 設計と製造が分離(水平分業) | 垂直統合(設計+製造が同じ会社) |
| 設計 | NVIDIA, Apple, Qualcomm | SK Hynix, Samsung, Micron |
| 製造 | TSMC, Samsung | 同じ会社が自社で |
| なぜ | 設計が多様 → 万能工場が合理的 | 規格品 → 製造ノウハウが競争力。外注したらコスト差がなくなる |
メモリはコモディティ(汎用品)。差別化できるのは製造コストと歩留まりだけ → 製造プロセスを外に出したら終わり。
3. 素材 — 日本企業が静かに握るチョークポイント
全ての半導体の出発点。純度99.999999999%(イレブンナイン)のシリコン結晶を薄くスライスした円盤。
シリコンの最外殻電子は4個 → 4方向に結合 → きれいな結晶構造。不純物を混ぜる(ドーピング)で導体/絶縁体を制御。
先端パッケージ基板の絶縁層。Ajinomoto Build-up Film。あの食品の味の素がアミノ酸研究から開発。
先端チップの基板はガラス繊維を使えない(表面がデコボコになって微細配線ができない)。ABFは低損失 + 耐熱 + 均一性を全て満たす唯一の素材。
銅箔(配線)+ 絶縁層(樹脂)を交互に何十層も積層した基板素材。
═══╤═══╤═══ ← 銅配線(回路パターン)
───┼───┼─── ← 絶縁層(ABFフィルム or 樹脂+ガラス繊維)
═══╤═══╤═══ ← 銅配線
───┼───┼─── ← 絶縁層
│ │
層間接続(ビア)
AI向けは超高速信号が流れるため、絶縁層の品質(信号劣化の少なさ)が特に重要。
📚 より詳しく
- Wikipedia: Silicon wafer — シリコンウェハの製造工程(CZ法)
- 味の素公式: ABFの紹介 — アミノ酸研究から半導体素材へ
4. テスト — 全数検査とビニング
完成したチップは全数検査する。普通の工業製品なら抜き取り検査で済むが、半導体は違う。
なぜ全数検査か
800億個のトランジスタが全部完璧に動く確率はゼロに近い。製造の全工程でランダムにばらつきが出る:
- 露光: 光の微妙なブレでパターンが数原子分ずれる
- エッチング: プラズマの密度が場所によって微妙に違う
- 成膜: 膜の厚さがウェハの中心と端で微妙に違う
- 微粒子: クリーンルームでも数nmのゴミは完全には排除できない
切り出したチップ
全数
検査
全コア正常・高クロック
→ 最上位製品(高価格)
ほぼ正常・一部コア無効化
→ 中位製品
欠陥多い・多くのコア無効化
→ 下位製品
→ 廃棄
例: NVIDIAのH100とH800、GeForce RTX 4090と4080は同じシリコンから生まれた兄弟。検査結果でランク分けされているだけ。
テスト装置メーカー
| 会社 | 本社 | 強み |
|---|---|---|
| アドバンテスト | 日本 | 先端ロジック(GPU/CPU)のテスタで世界トップクラス |
| テラダイン | 米国 | メモリテスタに強い |
装置メーカーの構造: ASML(露光装置を作る)と同じで、アドバンテストは「テスト装置を作る」会社。テスト作業自体はTSMCやNVIDIAが自社で行う。
📚 より詳しく
- Wikipedia: Product binning — 半導体のビニング(等級選別)の仕組み
- YouTube: Semiconductor binning — なぜ同じチップから異なる製品が生まれるか
5. ネットワーク — GPU数千枚を繋ぐ神経
AI学習はGPU 1枚では不可能。数千〜数万枚のGPUを繋いで同時に計算する。全GPUが計算結果を交換して同期するから、ネットワークが遅いと全員が待ち状態になり、計算能力が無駄になる。
メモリウォールと同じ構造の問題
Lesson 1: GPU計算速度 >> DRAMの帯域 → メモリウォール → HBMで解決
Lesson 4: GPU計算速度 >> ネットワーク帯域 → 通信ウォール → 高速ネットワークで解決
「計算は速いのにデータが来ない」という同じパターンが、チップ内(メモリ)でもデータセンター規模(ネットワーク)でも起きている。
銅配線
TSV / CoWoS インターポーザ
NIC / 銅線イーサネット NVIDIA(Mellanox), Broadcom
光トランシーバ + 光ファイバー Coherent, Broadcom, Corning
距離が遠いほど銅線では信号が減衰する → 光に変換して飛ばす必要がある。
NVIDIAがMellanoxを買収した理由
2020年、約70億ドル(約1兆円)でイスラエルのMellanoxを買収。
GPU(計算)+ InfiniBand(通信)をセットで提供 → 「AIデータセンターまるごとNVIDIA」という垂直統合戦略。
GPUだけ速くても通信がボトルネックになる。計算と通信の両方を押さえにいった。
📚 より詳しく
- Wikipedia: InfiniBand — GPU間高速通信の標準規格
- Wikipedia: Optical transceiver — 電気⇔光変換の仕組み
6. バリューチェーン全体図 — Level 1 完成
Lesson 1〜4で学んだ全てが繋がった。AIチップが生まれてデータセンターで動くまでの全体像。
Qualcomm, AMD
装置: ASML, TEL, Lam
Micron, Kioxia
ASE, Amkor
味の素(ABF)
テラダイン
Broadcom, Arista
Google, Meta
💻 水平分業 = マイクロサービスアーキテクチャ
// 半導体業界 = 究極のマイクロサービス
// 各社が1つの専門領域に特化し、APIで繋がる
DesignService (NVIDIA) → 設計データ(GDSII)
FabService (TSMC) → シリコンダイ
MemoryService (SK Hynix) → HBM
PackagingService (TSMC CoWoS) → パッケージ済みチップ
MaterialService (信越/味の素) → ウェハ/ABF
TestService (アドバンテスト) → テスト済み良品
NetworkService (Mellanox) → 接続
CloudService (AWS/Azure) → エンドユーザーに提供
// 1社でも落ちるとシステム全体が止まる
// → 各ノードがチョークポイントになりうる
📖 このページの用語集
| 用語 | 正式名称 / 意味 | 一言で |
|---|---|---|
| CoWoS | Chip on Wafer on Substrate | TSMCの先進パッケージング。インターポーザでGPU+HBMを横並び接続 |
| インターポーザ | Interposer | チップ間を繋ぐ超微細配線入りのシリコン板 |
| TSV | Through Silicon Via / シリコン貫通電極 | シリコンチップを貫通する垂直電極。HBMの積層に使用 |
| ABF | Ajinomoto Build-up Film | 味の素が開発した絶縁フィルム。先端パッケージ基板に不可欠 |
| CCL | Copper Clad Laminate / 銅張積層板 | 銅箔+絶縁層の積層基板素材 |
| ビニング | Binning | 完成チップを検査結果で等級選別すること |
| NIC | Network Interface Card | サーバーのネットワーク接続チップ |
| DPU | Data Processing Unit | ネットワーク処理に特化したプロセッサ |
| InfiniBand | InfiniBand | GPU間高速通信の規格。NVIDIAが主導 |
| 光トランシーバ | Optical Transceiver | 電気信号⇔光信号の変換装置。長距離通信に不可欠 |
| イレブンナイン | 99.999999999% | シリコンウェハの純度。9が11個並ぶ |
🧠 セルフチェック
Q1: CoWoSでシリコンインターポーザを使う理由は?普通の基板ではなぜダメか?
答えを見る
HBMとGPUの接続に1024bit(数千本)の配線が必要。普通の基板は配線ピッチが粗すぎて確保できない。シリコンインターポーザなら半導体と同じ微細配線が可能で、100倍以上細かい配線ピッチを実現できる。
Q2: メモリメーカー(SK Hynix等)がTSMCに製造を外注しない理由は?
答えを見る
メモリは規格品(コモディティ)で差別化できない。競争力の源泉は製造コストと歩留まりのノウハウ。外注すると3社の製品が同じコストになり、秘伝の製造ノウハウも流出する → 競争力がゼロになる。
Q3: 味の素のABFフィルムが先端半導体に不可欠な理由を3つ挙げよ。
答えを見る
①低損失(超高速信号が劣化しない)②耐熱性(GPU 300W+の発熱に耐える)③均一性(何十層も積層しても膜厚にムラがない)。ガラス繊維入りだと表面がデコボコになり微細配線ができないため、樹脂フィルムのみで全てを満たす必要がある。
Q4: 同じウェハから生まれたチップがRTX 4090とRTX 4080として違う価格で売られる仕組みは?
答えを見る
ビニング(等級選別)。全数検査で各チップの品質を判定し、全コア正常・高クロックのものを最上位製品(高価格)、一部コアに欠陥があるものはコアを無効化して下位製品(安価格)として販売する。
Q5: NVIDIAがMellanoxを70億ドルで買収した戦略的意図は?
答えを見る
GPU(計算)だけ速くてもネットワーク(通信)がボトルネックになる。AI学習はGPU数千枚の同期が必要で、通信が遅いと全GPUが待ち状態に。計算+通信をセットで提供する垂直統合戦略。
Q6: バリューチェーン8段階を上流から順に全て挙げ、各段階の代表企業を1社ずつ答えよ。
答えを見る
①設計(NVIDIA) → ②製造(TSMC) → ③メモリ(SK Hynix) → ④パッケージング(TSMC CoWoS) → ⑤素材(信越化学/味の素) → ⑥テスト(アドバンテスト) → ⑦ネットワーク(Broadcom/Mellanox) → ⑧データセンター(AWS/Google)。1社でも詰まるとシステム全体が止まる。