今回は、「今さら聞けないURLの文字列の規則」というテーマで説明していこうと思います。
皆さんはWebページを見たり、YouTubeで動画を見たり、普段スマホを触っているうちに何気なくURLを扱っていると思いますが、その文字列がどういう規則で成り立っているのかまで知っている人は少ないと思います。
URLの文字列の規則を知ることで、
- LINEなどで共有するURLをコンパクトにできる
- フィッシング詐欺に騙されにくくなる
- 自分でカスタマイズすることができる
といった感じで、デジタルライフがもっと快適になると思います。
それでは早速、説明していきますね。
そもそもURLって何?
URLはインターネット上のウェブサイトの住所のようなものです。
家を探すために住所が必要なように、コンピュータはウェブサイトを見つけるためにURLが必要です。URLは、特別なコードのようなものであり、コンピュータにインターネット上で見たいウェブサイトがどこにあるかを知らせます。
どこでURLを使っているの?
URLは様々な場面で使用されています。
- ウェブブラウジング:Google ChromeやMozilla FirefoxなどのウェブブラウザのアドレスバーにURLを入力し、エンターキーを押すことでウェブサイトにアクセスできます。
- リンク共有:メール、インスタントメッセージ、またはURLをテキストドキュメントにコピー&ペーストすることで他の人とURLを共有することができます。
- ブックマーク:URLをブックマークとしてウェブブラウザに保存することで、後で簡単にアクセスできます。
- 検索エンジン:Googleなどの検索エンジンでURLを検索語として使用することで、特定のウェブサイトの情報を検索できます。
- API呼び出し:開発者はソフトウェアプログラムでURLを使用して、サーバからデータを取得したりAPIにアクセスしたりすることができます。
5つ目の「API呼び出し」が少し難しいかもしれませんが、
ウェブサイトは、データとプログラムから成り立っていて、簡単な例で言えばホームページを閲覧するのも、ウェブサイトにあるデータ(情報)をブラウザを通して視覚情報に変換するというプログラムによって成り立っています。
一般的には、データ(情報)とプログラムは同じウェブサイト上にありますが、複雑なプログラムになると開発に時間がかかるので、プログラムの部分だけ他のウェブサイトを借りる場合もあります。この「プログラムの部分を他のウェブサイトに借りにいく」のを「API呼び出し」と言います。
URLの文字列の規則1:httpとは
まず冒頭のhttp:// , https://について。
これHyperText Transfer Protocol(ハイパーテキスト トランスファー プロトコル)の略で、
ハイパーテキストはウェブサイトのこと、トランスファーは情報のやり取り、プロトコルは決まりごとという意味なので、「これからウェブサイトの情報をやり取りしますよ」という宣言のようなものです。
ちなみにhttpとhttpsの違いは、s(secret)の有無で、情報のやり取りを暗号化するかどうかを決めています。暗号化しないと、情報をやり取りしている間に傍聴されたり、データを改ざんされたりするので、セキュリティ上望ましくありません。
URLの文字列の規則2:ドメインとは
次に、https://以降の.com(ドットコム)や.co.jp、.jpなどで終わる部分について。
これは「ドメイン」と呼ばれています。住所で言うところの都道府県から番地までに該当します。なのでドメインは重複できず、早く取得した人が永久的に使い続けることができます。
ここがURLで一番重要なところで、1文字でも誤りがあれば正しくウェブサイトにアクセスできません。
またフィッシングサイトなどでは、有名サイトのドメインを1文字だけ変えたドメインを使っている場合が多く、しっかり正規のドメインかどうかを見極めてからアクセスすることが大切です。
URLの文字列の規則3:"?"って何?
以下は僕のInstagramのプロフィールのURLですが、
ここまでの説明で、https://は「これからウェブサイトの情報を暗号化してやり取りしますよ」という宣言、instagram.comは「ドメイン」だと分かると思います。
ちなみにドメインと"?"で挟まれた文字列(kenfee_official)は、住所で言うところのマンションやアパートの部屋番号になり、住所の一部です。
では、"?"以降の文字列は何でしょうか?
"?"以降は補足情報を意味し、"?"以下の文字列は消しても、ウェブサイトにはアクセスできますが、少し注意が必要です。
例えば最近の配送業者は、配達後手渡しでなく、置き配という玄関前に置いて放置するという手法も行っています。この場合、住所の情報にプラスして、「置き配」という補足情報を加える必要があります。なので、やみくもに"?" 以降を消せばいいわけではなく、"?"以降を消したために、正常にサービスが提供されず不利益を被る可能性もあります。
一方で、データ収集のためにも利用されます。
今回の例に挙げた"igshid=YmMyMTA2M2Y="はパラメータと呼ばれ、アクセス解析に利用されています。恐らく、Instagramを運用するMeta社が「プロフィール画面からリンクを生成して共有した場合、どれぐらいリーチがあるか」を分析するためのものだと思われます。
今回のような場合は"?"以降は削除してもらっても大丈夫です。
まとめ
一見、複雑に見えるURLでも"?"以降が長いだけで、住所に該当する部分は短いという場合もありますし、知れば知るほどURLは奥が深いです。
URLを正しく理解できているだけで、ITリテラシーはかなり上がると思いますし、何よりも悪意のあるウェブサイトに騙されてアクセスしなくなると思います。
今回の内容が皆さんにとって少しでも参考になれば幸いです。