hook ineerHTML，innerHTML传参的变量提取所有原始URL-Go服务器开发

要 Hook innerHTML 属性并提取传入的 HTML 字符串中的所有原始 URL，可以通过 JavaScript Proxy 或 Object.defineProperty 拦截 innerHTML 的赋值操作，然后使用正则表达式或 DOM 解析方法提取 URL。以下是实现方法：

方法 1：Hook `innerHTML` 并提取 URL（Proxy/defineProperty）

步骤

拦截 innerHTML 的 setter
通过修改元素的 innerHTML 属性，在赋值时捕获 HTML 字符串。
从 HTML 中提取所有 URL
使用正则表达式或 DOM 解析（如 DOMParser）提取链接。

代码实现

// Hook单个元素的innerHTML
function hookElementInnerHTML(element) {
    const originalDescriptor = Object.getOwnPropertyDescriptor(
        Object.getPrototypeOf(element),
        'innerHTML'
    );

    Object.defineProperty(element, 'innerHTML', {
        set: function(value) {
            // 提取URL的逻辑
            extractUrlsFromHtml(value);
            
            // 继续原始赋值操作
            originalDescriptor.set.call(this, value);
        },
        get: function() {
            return originalDescriptor.get.call(this);
        }
    });
}

// 从HTML文本中提取URL
function extractUrlsFromHtml(html) {
    const urls = [];
    
    // 方法1：正则匹配（简单场景）
    const regex = /(href|src)=["'](https?:\/\/[^"']+)["']/gi;
    let match;
    while ((match = regex.exec(html)) !== null) {
        urls.push(match[2]); // match[2]是URL部分
    }

    // 方法2：DOM解析（更准确）
    const doc = new DOMParser().parseFromString(html, 'text/html');
    ['a', 'img', 'script', 'link'].forEach(tag => {
        doc.querySelectorAll(tag).forEach(el => {
            const url = el.href || el.src;
            if (url && url.startsWith('http')) urls.push(url);
        });
    });

    console.log('Extracted URLs:', urls);
}

// Example: Hook某个div的innerHTML
const targetDiv = document.querySelector('#myDiv');
hookElementInnerHTML(targetDiv);

//测试：设置innerHTML时会触发URL提取
targetDiv.innerHTML = '<a href="https://example.com">Link</a><img src="http://test.com/image.png">';

方法2：批量Hook所有元素的innerHTML

如果需要监控页面中所有动态插入的内容，可以劫持 Element.prototype.innerHTML：

(function() {
    const originalInnerHTML = Object.getOwnPropertyDescriptor(
        Element.prototype,
        'innerHTML'
    ).set;

    Object.defineProperty(Element.prototype, 'innerHTML', {
        set: function(value) {
            extractUrlsFromHtml(value); //调用之前的提取函数
            originalInnerHTML.call(this, value);
        }
    });
})();

注意事项

性能影响
Hook innerHTML可能对性能有轻微影响，建议仅在调试或分析时使用。
兼容性
- DOMParser需要现代浏览器支持。
- Proxy方案无法直接拦截原生属性，优先用Object.defineProperty。
动态内容
如果URL是通过JavaScript动态生成的（非直接写在HTML中），需额外Hook相关API（如fetch、appendChild）。

输出示例

当设置以下代码时：

document.body.innerHTML = '<a href="https://google.com">Google</a>';

控制台会输出：

Extracted URLs: ["https://google.com"]

这种方法可用于爬虫、安全分析或前端监控场景。

内容由零声教学AI助手提供，问题来源于学员提问

hook ineerHTML，innerHTML传参的变量提取所有原始URL

方法 1：Hook `innerHTML` 并提取 URL（Proxy/defineProperty）

步骤

代码实现

方法2：批量Hook所有元素的innerHTML

注意事项

输出示例

golang云原生

diff --git a/mtk/package/kernel/wlan_driver/gen4m/mt6639_driver/os/linux/gl_kal.c b/mtk/package/kernel/wlan_driver/gen4m/mt6639_driver/os/linux/gl_kal.c 解释此命令

git 如何把更改提交到本地

执行什么命令可以输出 git diff 命令的输出片段，显示两个文件之间的差异

raco@ubuntu_2204:~/data/mtk_code/T830/T830/openwrt/build_dir/target-aarch64-openwrt-linux-musl_musl/linux-gem6xxx_evb6990_cpe_mt7992_emmc/hw_nat$ git diff hwnat_ioctl.c > temp_patch.patch raco@ubuntu_2204:~/data/mtk_code/T830/T830/openwrt/build_di...

PG主节点挂了，为什么备节点不会自动升主

git 拉取指定commit id的代码

WordPress自定义分享插件可以分享到微信朋友圈的那种我要自己写插件

如何在一个docker中运行多个程序

golang ipv6 地址转整数

Vue.prototype.zipMedia = async function(media) { const zip = new JSZip(); console.log("media.length: ", media.length); console.log("zipMedia_media: ", media); if (!media || media.length === 0) { return null; // 返回 null 表示没...

golang 布隆过滤器

golang + rdp 协议+tls，实现远程桌面服务端和客户端

git 拉取指定commit id的代码

golang为什么将method写在类外?

本地分支如何与远程分支关联

golang json字符串转protobuf message

https://xxx.mirror.aliyuncs.com 这个地址从哪里获取

golang 格式化打印bool类型

git 修改submodule的地址

修改代码from sklearn preprocessing import PolynomialFeatures from sklearnpipeline import Pipeline from sklearnlinear model import LinearRegression from sklearn preprocessing import standardScaler def fit and predict(X train,ytrainXtest): #xtrain:num...

docker build时提示manifest for ubuntu:jammy not found

git 全局忽略文件权限变更

raise TypeError(f"pic should be PIL Image or ndarray. Got {type(pic)}") TypeError: pic should be PIL Image or ndarray. Got 是什么错误，该怎么改

git push -u origin main 错误：源引用规格 main 没有匹配

联系我们

hook ineerHTML，innerHTML传参的变量提取所有原始URL

方法 1：Hook innerHTML 并提取 URL（Proxy/defineProperty）

步骤

代码实现

方法2：批量Hook所有元素的innerHTML

注意事项

输出示例

相关推荐

git 拉取指定commit id的代码

WordPress自定义分享插件 可以分享到微信朋友圈的那种 我要自己写插件

如何在一个docker中运行多个程序

golang ipv6 地址转整数

Vue.prototype.zipMedia = async function(media) { const zip = new JSZip(); console.log("media.length: ", media.length); console.log("zipMedia_media: ", media); if (!media || media.length === 0) { return null; // 返回 null 表示没...

golang 布隆过滤器

golang + rdp 协议+tls，实现远程桌面服务端和客户端

git 拉取指定commit id的代码

golang为什么将method写在类外?

联系我们

登录

注册

方法 1：Hook `innerHTML` 并提取 URL（Proxy/defineProperty）

WordPress自定义分享插件可以分享到微信朋友圈的那种我要自己写插件