2 回答

TA贡献2051条经验 获得超10个赞
您不应该使用正则表达式。而是使用DOM解析器功能:
var input = 'hello <script\>alert("I am stealing your data");</script\>';
var span = document.createElement("span");
span.innerHTML = input; // This will not execute scripts
// Remove all script tags within this span element:
Array.from(span.querySelectorAll("script"), script => script.remove());
// Get the remaining HTML out of it
var scriptless = span.innerHTML;
console.log(scriptless);
请注意,让用户将任意HTML传递给您的应用程序是一个非常糟糕的主意。清理涉及的不仅仅是删除脚本标记。

TA贡献1801条经验 获得超16个赞
您不需要使用正则表达式,因为它们很容易欺骗,不适合解析HTML内容,尤其是不受信任的HTML内容。
相反,您可以使用a DOMParser
创建新文档并使用DOM API删除所有脚本标记,然后返回其余内容:
function sanitise(input) {
const parser = new DOMParser();
const doc = parser.parseFromString(input, "text/html");
let scripts = [...doc.getElementsByTagName('script')]
scripts.forEach(script => script.remove());
return doc.body.textContent.trim();
}
//using the + because otherwise StackSnippets breaks
console.log(sanitise("hello <script>alert('I am stealing your data');</scr"+"ipt>"))
添加回答
举报