11
2025
04
00:43:10

PHP 从链接中提取出顶级域名

用 PHP 解析出链接中的顶级域名。众所周知,如果只需要解析出链接中的域名部分,使用 PHP 自带的 parse_url 函数即可做到:


<?php
$url = 'https://hqyman.cn/hqy'; 
echo parse_url($url)['host'];    // hqyman.cn

如果需要进一步从中间提取出顶级域名,那么只需要按点(.)分割成数组,再取数组中最后两个元素组合到一起,即可得到 hqyman.cn

然而有一些域名却不按“常理”出牌,比如 http://www.baidu.net.cn/ 这个链接,它对应的“顶级域名”实际上是 baidu.net.cn 这个三级域名。类似的域名还有 xxx.com.cn、 xxx.org.cnxxx.gov.cn 等等。

找了下资料,发现有一个专门的Public Suffix List公共项目,收集了所有的公共域名后缀!

Public Suffix List 是一个不断更新的数据库,旨在为 Web 应用程序提供标准化的接口,以正确处理 Cookie、安全策略和其他与域名相关的问题。这个列表由志愿者维护,并进行严格的验证,确保了数据的质量和准确性。

更妙的是还有个相对应的开源 PHP 库 https://github.com/jeremykendall/php-domain-parser  。不过,这个库需要用 composer 导入,我用的虚拟主机没有 composer。尝试着改了下,要改动的文件实在是太多了。遂放弃。

简单研究了一下 Public Suffix List 的规则列表,发现并不复杂,于是花了点时间自己写了一个轻量级的解析库,无任何其它依赖,支持中文域名解析,支持自动纠错,支持自动更新数据库。测试了一下效果非常棒!已经开源到 GitHub 上了,有需要的可以自取

https://github.com/mengkunsoft/PHP-Domain-Parser 




// 引入模块

include_once('DomainParser.class.php');

 

// 初始化

$parser = new DomainParser();

 

// 更新公共域名后缀数据库(可选,一般每周更新一次就够了,无需每次更新)

// $parser->update();

 

// 解析链接

$url = 'http://test.abc.tool.mkblog.cn/pathto/1';

$result = $parser->parse($url);

 

// 获取结果

if ($result['code'] == 200) {

    echo $result['icann'];

}



解析结果

字段类型说明
codeint200 - 解析成功 / 其他数值 - 解析失败
msgstring如果解析失败,返回错误消息
hoststring返回解析出的 host 部分
icannstring返回基于 Public Suffix List 中 ICANN 规则解析出的顶级域名
privatestring返回基于 Public Suffix List 中 PRIVATE 规则解析出的顶级域名

更具体的使用说明可以看 GitHub 上的 README~

参考资料




推荐本站淘宝优惠价购买喜欢的宝贝:

image.png

本文链接:https://hqyman.cn/post/10368.html 非本站原创文章欢迎转载,原创文章需保留本站地址!

分享到:
打赏





休息一下~~


« 上一篇 下一篇 »

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

请先 登录 再评论,若不是会员请先 注册

您的IP地址是: