首页 / 问答 / C#&.NET Core(.NET 7)程序如何去掉HTML标签中的style格式,只保留标签和文本呢?

C#&.NET Core(.NET 7)程序如何去掉HTML标签中的style格式,只保留标签和文本呢?

.NET C# HTML .NET Core 566 次浏览
0

在C#和.NET Core(.NET 7)中,如果我有一段包含HTML标签的文本,如下:

string htmlInput = "<p style=\"color: red;\">This is a <b>sample</b> text with <a href=\"#\">HTML</a> tags.</p>";

我想要去掉其中的所有style样式,只保留标签和文本内容,应该如何实现这个操作呢?

换句话说,我想要一个方法或解决方案,将类似于上面示例中的HTML代码转换为:

<p>This is a <b>sample</b> text with <a href="#">HTML</a> tags.</p>

以便在保留标签和文本的同时去掉所有的样式信息。

请问应该如何进行这样的HTML标签处理呢?

回复 [×]
提交评论
请输入评论内容

1 个回答

  • 0

    要在C#程序中将HTML标签的所有样式去掉,只保留标签和文本,可以使用正则表达式来执行这个任务。下面是一个示例程序,演示了如何使用C#和正则表达式来实现这个需求:

    在上面的示例中,我们定义了一个 RemoveStyles 函数,该函数接受包含HTML的字符串作为输入,并使用正则表达式来去掉所有样式属性。正则表达式 pattern 匹配HTML标签,并删除其内部的 style 属性。最后,Regex.Replace 方法用空字符串替换匹配的部分,从而去除了样式。

    运行上述代码,将会输出去除样式后的HTML,只保留标签和文本:

    请注意,这个示例中的正则表达式可能不适用于所有HTML标签的情况,具体取决于您的HTML内容和要求。因此,您可能需要根据实际情况调整正则表达式。此外,如果您需要处理更复杂的HTML,请考虑使用HTML解析器库来更好地处理HTML文档。

    Rector的个人主页

    Rector

    2023-09-27 回答

    我来回答