1 Star 0 Fork 123

叶宝龙/hed_autocanny

forked from mynameisi/hed_autocanny 
加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
文件
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
util.py 6.02 KB
一键复制 编辑 原始数据 按行查看 历史
叶宝龙 提交于 2024-05-09 12:30 . update util.py.
import cv2 # 导入OpenCV库,用于图像处理
import numpy as np # 导入NumPy库,用于数组操作
from skimage.metrics import mean_squared_error
import time
from skimage.filters import threshold_otsu
from tqdm import tqdm
# 定义一个名为CropLayer的类
class CropLayer(object):
# 构造函数,用于初始化裁剪的起始和结束位置
def __init__(self, params, blobs):
self.xstart = 0
self.xend = 0
self.ystart = 0
self.yend = 0
# 该层接收两个输入。
# 我们需要将第一个输入blob裁剪成与第二个输入blob相同的形状(保持批大小和通道数不变)
def getMemoryShapes(self, inputs):
# 获取输入形状和目标形状
inputShape, targetShape = inputs[0], inputs[1]
# 获取批大小和通道数
batchSize, numChannels = inputShape[0], inputShape[1]
height_in, width_in = inputShape[2], inputShape[3] # 获取输入的高度和宽度
height_out, width_out = targetShape[2], targetShape[3] # 获取目标形状的高度和宽度
# 居中裁剪方案
self.ystart = (height_in - height_out) //2
self.xstart = (width_in - width_out) //2
# 左上角裁剪方案
# self.ystart=0
# self.xstart=0
# 计算裁剪的结束位置
self.yend = self.ystart + height_out
self.xend = self.xstart + width_out
# 返回裁剪后的形状
return [[batchSize, numChannels, height_out, width_out]]
# 前向传播函数,进行裁剪操作
def forward(self, inputs):
return [inputs[0][:, :, self.ystart:self.yend, self.xstart:self.xend]]
# 使用cv2.dnn_registerLayer函数将自定义裁剪层注册到网络中
cv2.dnn_registerLayer('Crop', CropLayer)
# 该函数使用预训练的 HED (Holistically-Nested Edge Detection) 模型来检测图像中的边缘。
# 通过使用 OpenCV 库加载模型并传递输入图像,该函数生成并返回二值化的边缘检测结果。
# 参数:
# img_rgb (numpy.ndarray): 输入的 RGB 图像,图像尺寸应为 (height, width, 3)。
# blur_window (int, 可选): 用于对输入图像和边缘检测结果进行高斯模糊的窗口大小。默认值为 5。
# scalefactor (float, 可选): 输入图像在创建 blob 时的缩放系数。默认值为 1.0。
# 返回:
# hed (numpy.ndarray): 二值化的边缘检测结果,图像尺寸与输入图像相同。
# 示例:
# >>> img = cv2.imread("example.jpg")
# >>> hed = get_hed(img)
# >>> plt.imshow(hed)
def get_hed(img_rgb,blur_window=5, scalefactor=1.0):
# 指定模型文件的路径
model_path ='model/hed_pretrained_bsds.caffemodel'
prototxt_path ='model/deploy.prototxt'
# 使用OpenCV加载预训练模型
net = cv2.dnn.readNetFromCaffe(prototxt_path,model_path)
# 加载输入图像
img_rgb=cv2.GaussianBlur(img_rgb,(blur_window,blur_window), 0)
h,w = img_rgb.shape[:2]
# 从图像创建blob(一大块数据)
blob = cv2.dnn.blobFromImage(img_rgb, scalefactor=scalefactor, size=(w,h),
mean=(105, 117, 123),
swapRB=False, crop=False)
# 将 blob 设置为网络的输入
net.setInput(blob)
# 执行前向传递以获得边缘检测结果
hed_output = net.forward()
# 从输出中提取边缘图
hed = hed_output[0, 0]
return hed
# 该函数通过比较输入的灰度图像与 HED 边缘检测结果之间的均方误差 (MSE),自动选择最佳的 Canny 边缘检测阈值参数。使用最佳阈值参数计算最终的边缘检测结果。
# 参数:
# img_gray (numpy.ndarray): 输入的灰度图像,图像尺寸应为 (height, width)。
# hed (numpy.ndarray): 使用 HED 模型生成的边缘检测结果,图像尺寸应与输入灰度图像相同。
# 返回:
# edge_img (numpy.ndarray): 使用最佳阈值参数生成的 Canny 边缘检测结果。
# best_params (tuple): 包含最佳阈值参数的元组,格式为 (best_sigma, min_mse, lower, upper)。
# best_sigma: 为具有最低MSE的sigma值
# min_mse: 最低的mse值
# lower, upper: 用best_sigma进行canny时的上下限
# plot_data (tuple): 包含用于绘制 MSE 与 sigma 值关系图的数据,格式为 (sigma_values, mse_values)。
# sigma_values: 所有测试过的sigma_value,建议范围从0.001到1.0实验100个值
# mse_values: 对于每一个sigma的mse值
# 示例:
# >>> img_gray = cv2.cvtColor(cv2.imread("example.jpg"), cv2.COLOR_BGR2GRAY)
# >>> hed = get_hed(cv2.imread("example.jpg"))
# >>> edge_img, best_params, plot_data = auto_canny(img_gray, hed)
# >>> plt.imshow(edge_img)
def auto_canny(img_gray, hed):
# 对图像进行高斯模糊处理,以降低噪声对边缘检测的影响
img_blur = cv2.GaussianBlur(img_gray, (5, 5), 0)
median = np.median(img_blur)
# 测试的所有sigma值(100个sigma值,范围从0.001到1.0)以及每一个值对应的MSE结果
sigma_values = np.linspace(0.001, 1.0, 100)
mse_values = []
min_mse = float('inf')
best_sigma = None
# 循环遍历sigma值,并计算每个值的MSE(使用tqdm显示进度条)
for sigma in tqdm(sigma_values, desc="搜索最佳sigma: ", unit="sigma"):
lower = int(max(0, (1.0 - sigma) * median))
upper = int(min(255, (1.0 + sigma) * median))
auto_edge = cv2.Canny(img_blur, lower, upper)
mse = mean_squared_error(hed, auto_edge)
# 准备绘制MSE与sigma关系图的数据
#添加mse到列表中
mse_values.append(mse)
if mse < min_mse:
min_mse = mse
best_sigma = sigma
#设置延时
time.sleep(0.1)
# 使用最佳sigma值计算最终的边缘检测结果
best_lower = int(max(0, (1.0 - best_sigma) * median))
best_upper = int(min(255, (1.0 + best_sigma) * median))
edge_img = cv2.Canny(img_blur, lower, upper)
return edge_img, (best_sigma, min_mse, lower, upper), (sigma_values, mse_values)
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
1
https://gitee.com/ye-baolong/hed_autocanny.git
git@gitee.com:ye-baolong/hed_autocanny.git
ye-baolong
hed_autocanny
hed_autocanny
master

搜索帮助