摘要:为了提升变电站复杂场景的图像理解和异常检测结果的准确性,本文提出了基于多模态大语言模型的变电站复杂场景理解与异常检测方法。该方法的输入包含变电站图像和提示文本2种模态的信息,首先,分别使用视觉模型(试读)...