├── CMakeLists.txt
├── README.md
├── coco_eval
    └── coco_eval.py
├── demo
    ├── CMakeLists.txt
    └── demo.cpp
├── eval
    ├── CMakeLists.txt
    └── eval.cpp
├── images
    ├── .ptp-sync-folder
    ├── dog.jpg
    └── person.jpg
├── prototxt
    ├── mobilenet_v1_yolov3.prototxt
    ├── mobilenet_v2_yolov3.prototxt
    ├── yolov3-spp.prototxt
    ├── yolov3-tiny.prototxt
    ├── yolov3_416x416.prototxt
    ├── yolov3_512x512.prototxt
    ├── yolov3_608x608.prototxt
    └── yolov4.prototxt
└── src
    ├── activation_kernels.cu
    ├── activations.h
    ├── blas.h
    ├── blas_kernels.cu
    ├── box.cpp
    ├── box.h
    ├── cuda.cpp
    ├── cuda.h
    ├── detector.cpp
    ├── detector.h
    ├── image.cpp
    ├── image.h
    ├── image_opencv.cpp
    ├── image_opencv.h
    ├── yolo_layer.cpp
    └── yolo_layer.h


/CMakeLists.txt:
--------------------------------------------------------------------------------
 1 | cmake_minimum_required(VERSION 2.8)
 2 | project(caffe-yolov3)
 3 | 
 4 | set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -std=c++11")	# -std=gnu++11
 5 | 
 6 | # setup CUDA
 7 | find_package(CUDA)
 8 | 
 9 | set(
10 | 	CUDA_NVCC_FLAGS
11 | 	${CUDA_NVCC_FLAGS}; 
12 |     -O3 
13 | 	-gencode arch=compute_53,code=sm_53  #tegra tx1 
14 |         -gencode arch=compute_61,code=sm_61  #gtx 1060
15 | 	-gencode arch=compute_62,code=sm_62  #tegra tx2
16 | )
17 | 
18 | if(CUDA_VERSION_MAJOR GREATER 9)
19 | 	message("-- CUDA ${CUDA_VERSION_MAJOR} detected, enabling SM_72")
20 | 	set (
21 | 		CUDA_NVCC_FLAGS
22 | 		${CUDA_NVCC_FLAGS};
23 | 		-gencode arch=compute_72,code=sm_72 #xavier
24 |                 -gencode arch=compute_75,code=sm_75 #rtx2080 
25 | 	)
26 | endif()
27 | 
28 | # setup project output paths
29 | set(PROJECT_OUTPUT_DIR  ${PROJECT_BINARY_DIR}/${CMAKE_SYSTEM_PROCESSOR})
30 | set(PROJECT_INCLUDE_DIR ${PROJECT_OUTPUT_DIR}/include)
31 | 
32 | file(MAKE_DIRECTORY ${PROJECT_INCLUDE_DIR})
33 | file(MAKE_DIRECTORY ${PROJECT_OUTPUT_DIR}/bin)
34 | 
35 | message("-- system arch:  ${CMAKE_SYSTEM_PROCESSOR}")
36 | message("-- output path:  ${PROJECT_OUTPUT_DIR}")
37 | 
38 | set(CMAKE_RUNTIME_OUTPUT_DIRECTORY ${PROJECT_OUTPUT_DIR}/bin)
39 | set(CMAKE_LIBRARY_OUTPUT_DIRECTORY ${PROJECT_OUTPUT_DIR}/lib)
40 | set(CMAKE_ARCHIVE_OUTPUT_DIRECTORY ${PROJECT_OUTPUT_DIR}/lib)
41 | 
42 | 
43 | # build C/C++ interface
44 | include_directories(${PROJECT_INCLUDE_DIR} ${GIE_PATH}/include)
45 | include_directories(${PROJECT_INCLUDE_DIR} 
46 | 	/home/chen/caffe/include 
47 | 	/home/chen/caffe/build/include 
48 | )
49 | 
50 | 
51 | file(GLOB inferenceSources src/*.cpp src/*.cu )
52 | file(GLOB inferenceIncludes src/*.h )
53 | 
54 | cuda_add_library(yolov3-plugin SHARED ${inferenceSources})
55 | target_link_libraries(yolov3-plugin 
56 | 	/home/chen/caffe/build/lib/libcaffe.so  
57 | 	/usr/lib/x86_64-linux-gnu/libglog.so  
58 | 	/usr/lib/x86_64-linux-gnu/libgflags.so.2
59 |     	/usr/lib/x86_64-linux-gnu/libboost_system.so  
60 | 	/usr/lib/x86_64-linux-gnu/libGLEW.so.1.13  
61 | )
62 | 
63 | 
64 | # transfer all headers to the include directory
65 | foreach(include ${inferenceIncludes})
66 | 	message("-- Copying ${include}")
67 | 	configure_file(${include} ${PROJECT_INCLUDE_DIR} COPYONLY)
68 | endforeach()
69 | 
70 | 
71 | # create symbolic link for network data
72 | execute_process( COMMAND "${CMAKE_COMMAND}" "-E" "create_symlink" "${PROJECT_SOURCE_DIR}/data/networks" "${CMAKE_RUNTIME_OUTPUT_DIRECTORY}/networks" )
73 |   
74 | add_subdirectory(demo)
75 | add_subdirectory(eval)
76 | 
77 | #setup opencv
78 | FIND_PACKAGE(OpenCV REQUIRED)
79 | 
80 | TARGET_LINK_LIBRARIES(yolov3-plugin ${OpenCV_LIBS})
81 | 
82 | # install
83 | foreach(include ${inferenceIncludes})
84 |     install(FILES "${include}" DESTINATION include/yolov3-plugin)
85 | endforeach()
86 | 
87 | # install the shared library
88 | install(TARGETS yolov3-plugin DESTINATION lib/yolov3-plugin EXPORT yolov3-pluginConfig)
89 | 
90 | # install the cmake project, for importing
91 | install(EXPORT yolov3-pluginConfig DESTINATION share/yolov3-plugin/cmake)
92 | 


--------------------------------------------------------------------------------
/README.md:
--------------------------------------------------------------------------------
 1 | # caffe-yolov3
 2 | # Paltform
 3 | Have tested on Ubuntu16.04LTS with Jetson-TX2 and Ubuntu16.04LTS with gtx1060;
 4 | 
 5 | NOTE: You need change CMakeList.txt on Ubuntu16.04LTS with GTX1060.
 6 | 
 7 | # Install
 8 | git clone https://github.com/ChenYingpeng/caffe-yolov3
 9 | 
10 | cd caffe-yolov3
11 | 
12 | mkdir build
13 | 
14 | cd build
15 | 
16 | cmake ..
17 | 
18 | make -j6
19 | 
20 | # Darknet2Caffe
21 | darknet2caffe link [github](https://github.com/ChenYingpeng/darknet2caffe)
22 | 
23 | 
24 | # Demo
25 | First,download model and put it into dir caffemodel.
26 | 
27 | $ `./x86_64/bin/demo ../prototxt/yolov4.prototxt ../caffemodel/yolov4.caffemodel ../images/dog.jpg` 
28 | 
29 | # Eval
30 | 1. Run
31 | $ `./x86_64/bin/eval ../prototxt/yolov4.prototxt ../caffemodel/yolov4.caffemodel /path/to/coco/val2017/`
32 | 
33 | generate `coco_results.json` on `results/`.
34 | 
35 | 2. Run
36 | $ `python coco_eval/coco_eval.py --gt-json path/to/coco/annotations/instances_val2017.json  --pred-json results/coco_results.json`
37 | 
38 | 3. Eval results Yolov4 input size 608x608 from this repo.
39 | ```
40 |  Average Precision  (AP) @[ IoU=0.50:0.95 | area=   all | maxDets=100 ] = 0.428
41 |  Average Precision  (AP) @[ IoU=0.50      | area=   all | maxDets=100 ] = 0.664
42 |  Average Precision  (AP) @[ IoU=0.75      | area=   all | maxDets=100 ] = 0.461
43 |  Average Precision  (AP) @[ IoU=0.50:0.95 | area= small | maxDets=100 ] = 0.241
44 |  Average Precision  (AP) @[ IoU=0.50:0.95 | area=medium | maxDets=100 ] = 0.492
45 |  Average Precision  (AP) @[ IoU=0.50:0.95 | area= large | maxDets=100 ] = 0.575
46 |  Average Recall     (AR) @[ IoU=0.50:0.95 | area=   all | maxDets=  1 ] = 0.331
47 |  Average Recall     (AR) @[ IoU=0.50:0.95 | area=   all | maxDets= 10 ] = 0.517
48 |  Average Recall     (AR) @[ IoU=0.50:0.95 | area=   all | maxDets=100 ] = 0.544
49 |  Average Recall     (AR) @[ IoU=0.50:0.95 | area= small | maxDets=100 ] = 0.363
50 |  Average Recall     (AR) @[ IoU=0.50:0.95 | area=medium | maxDets=100 ] = 0.609
51 |  Average Recall     (AR) @[ IoU=0.50:0.95 | area= large | maxDets=100 ] = 0.710
52 | 
53 | ```
54 | 
55 | 4. Eval results Yolov4 input size 608x608 from offical model [AlexeyAB/YoloV4](https://github.com/AlexeyAB/darknet).
56 | ```
57 |  Average Precision  (AP) @[ IoU=0.50:0.95 | area=   all | maxDets=100 ] = 0.505
58 |  Average Precision  (AP) @[ IoU=0.50      | area=   all | maxDets=100 ] = 0.749
59 |  Average Precision  (AP) @[ IoU=0.75      | area=   all | maxDets=100 ] = 0.557
60 |  Average Precision  (AP) @[ IoU=0.50:0.95 | area= small | maxDets=100 ] = 0.357
61 |  Average Precision  (AP) @[ IoU=0.50:0.95 | area=medium | maxDets=100 ] = 0.559
62 |  Average Precision  (AP) @[ IoU=0.50:0.95 | area= large | maxDets=100 ] = 0.613
63 |  Average Recall     (AR) @[ IoU=0.50:0.95 | area=   all | maxDets=  1 ] = 0.368
64 |  Average Recall     (AR) @[ IoU=0.50:0.95 | area=   all | maxDets= 10 ] = 0.598
65 |  Average Recall     (AR) @[ IoU=0.50:0.95 | area=   all | maxDets=100 ] = 0.634
66 |  Average Recall     (AR) @[ IoU=0.50:0.95 | area= small | maxDets=100 ] = 0.500
67 |  Average Recall     (AR) @[ IoU=0.50:0.95 | area=medium | maxDets=100 ] = 0.680
68 |  Average Recall     (AR) @[ IoU=0.50:0.95 | area= large | maxDets=100 ] = 0.757
69 | 
70 | ```
71 | 
72 | # Download Model
73 | 
74 | Baidu link [model](https://pan.baidu.com/s/1yiCrnmsOm0hbweJBiiUScQ)
75 | 
76 | 
77 | # Note
78 | 
79 | 1.Only inference on GPU platform,such as RTX2080, GTX1060,Jetson Tegra X1,TX2,nano,Xavier etc.
80 | 
81 | 2.Support model such as yolov4,yolov3,yolov3-spp,yolov3-tiny etc.
82 | 
83 | 
84 | ### References
85 | Appreciate the great work from the following repositories:
86 | - [official/Yolo](https://pjreddie.com/darknet/yolo/)
87 | - [AlexeyAB/YoloV4](https://github.com/AlexeyAB/darknet)
88 | 


--------------------------------------------------------------------------------
/coco_eval/coco_eval.py:
--------------------------------------------------------------------------------
 1 | #Company:	Synthesis 
 2 | #Author: 	Chen
 3 | #Date:	2020/04/26	
 4 |  
 5 | """
 6 | COCO-Style Evaluations
 7 | 
 8 | put images here datasets/your_project_name/annotations/val_set_name/*.jpg
 9 | put annotations here datasets/your_project_name/annotations/instances_{val_set_name}.json
10 | put weights here /path/to/your/weights/*.pth
11 | change compound_coef
12 | 
13 | """
14 | 
15 | import json
16 | import os
17 | 
18 | import argparse
19 | import torch
20 | import yaml
21 | from tqdm import tqdm
22 | from pycocotools.coco import COCO
23 | from pycocotools.cocoeval import COCOeval
24 | 
25 | def eval(coco_gt, image_ids, pred_json_path):
26 |     # load results in COCO evaluation tool
27 |     coco_pred = coco_gt.loadRes(pred_json_path)
28 | 
29 |     # run COCO evaluation
30 |     print('BBox')
31 |     coco_eval = COCOeval(coco_gt, coco_pred, 'bbox')
32 |     coco_eval.params.imgIds = image_ids
33 |     coco_eval.evaluate()
34 |     coco_eval.accumulate()
35 |     coco_eval.summarize()
36 | 
37 | if __name__ == '__main__':
38 |     ap = argparse.ArgumentParser()
39 |     ap.add_argument('--gt-json', type=str, default='/home/chen/data/coco2017/annotations/instances_val2017.json', help='coco val2017 annotations json files')
40 |     ap.add_argument('--pred-json', type=str, default='results/darknet_yolov3_coco_results.json', help='pred coco val2017 annotations json files')
41 |     args = ap.parse_args()
42 |     print(args)
43 | 
44 |     pred_json_path = args.pred_json
45 | 
46 |     MAX_IMAGES = 10000
47 |     coco_gt = COCO(args.gt_json)
48 |     image_ids = coco_gt.getImgIds()[:MAX_IMAGES]
49 | 
50 |     eval(coco_gt, image_ids, pred_json_path)
51 | 


--------------------------------------------------------------------------------
/demo/CMakeLists.txt:
--------------------------------------------------------------------------------
1 | 
2 | file(GLOB demoSources *.cpp)
3 | #file(GLOB detectnetIncludes *.h )
4 | 
5 | cuda_add_executable(demo ${demoSources})
6 | target_link_libraries(demo yolov3-plugin)
7 | 


--------------------------------------------------------------------------------
/demo/demo.cpp:
--------------------------------------------------------------------------------
 1 | 
 2 | /*
 3 |  * Company:	Synthesis
 4 |  * Author: 	Chen
 5 |  * Date:	2018/06/04	
 6 |  */
 7 | 
 8 | #include <stdio.h>
 9 | #include <signal.h>
10 | #include <unistd.h>
11 | #include <sys/time.h>
12 | 
13 | #include "detector.h"
14 | 
15 | using namespace cv;
16 | 
17 | 
18 | bool signal_recieved = false;
19 | 
20 | 
21 | void sig_handler(int signo){
22 |     if( signo == SIGINT ){
23 |             printf("received SIGINT\n");
24 |             signal_recieved = true;
25 |     }
26 | }
27 | 
28 | uint64_t current_timestamp() {
29 |     struct timeval te; 
30 |     gettimeofday(&te, NULL); // get current time
31 |     return te.tv_sec*1000LL + te.tv_usec/1000; // caculate milliseconds
32 | }
33 | 
34 | int main( int argc, char** argv )
35 | {
36 |     std::string model_file;
37 |     std::string weights_file;
38 |     std::string image_path;
39 |     if(4 == argc){
40 |         model_file = argv[1];
41 |         weights_file = argv[2];
42 |         image_path = argv[3];
43 |     }
44 |     else{
45 |         LOG(ERROR) << "Input error: please input ./xx [model_path] [weights_path] [image_path]";
46 |         return -1;
47 |     }	
48 |     int gpu_id = 0;
49 |     //init network
50 |     Detector detector = Detector(model_file,weights_file,gpu_id);
51 | 
52 |     //load image with opencv
53 |     Mat img = imread(image_path);
54 |     
55 |     //detect
56 |     float thresh = 0.3;
57 |     std::vector<bbox_t> bbox_vec = detector.detect(img,thresh);
58 | 
59 |     //show detection results
60 |     for (int i=0;i<bbox_vec.size();++i){
61 |         bbox_t b = bbox_vec[i];
62 | 
63 |         int left  = b.x;
64 |         int right = b.x + b.w;
65 |         int top   = b.y;
66 |         int bot   = b.y + b.h;
67 |         rectangle(img,Point(left,top),Point(right,bot),Scalar(0,0,255),3,8,0);
68 |         LOG(INFO) << " label = " << b.obj_id
69 |                   << " prob = " << b.prob
70 |                   << " left = " << left
71 |                   << " right = " << right
72 |                   << " top = " << top
73 |                   << " bot = " << bot;
74 |     }
75 | 
76 |     ////////show with opencv
77 |     namedWindow("show",CV_WINDOW_AUTOSIZE);
78 |     imshow("show",img);
79 |     waitKey(0);
80 | 
81 |     LOG(INFO) << "done.";
82 |     return 0;
83 | }
84 | 
85 | 


--------------------------------------------------------------------------------
/eval/CMakeLists.txt:
--------------------------------------------------------------------------------
1 | 
2 | file(GLOB evalSources *.cpp)
3 | #file(GLOB detectnetIncludes *.h )
4 | 
5 | cuda_add_executable(eval ${evalSources})
6 | target_link_libraries(eval yolov3-plugin)
7 | 


--------------------------------------------------------------------------------
/eval/eval.cpp:
--------------------------------------------------------------------------------
  1 | 
  2 | /*
  3 |  * Company:	Synthesis
  4 |  * Author: 	Chen
  5 |  * Date:	2018/06/04	
  6 |  */
  7 | 
  8 | #include <stdio.h>
  9 | #include <signal.h>
 10 | #include <unistd.h>
 11 | #include <sys/time.h>
 12 | 
 13 | #include "detector.h"
 14 | 
 15 | using namespace cv;
 16 | 
 17 | 
 18 | bool signal_recieved = false;
 19 | 
 20 | static int coco_ids[] = { 1,2,3,4,5,6,7,8,9,10,11,13,14,15,16,17,18,19,20,21,22,23,24,25,27,28,31,32,33,34,35,36,37,38,39,40,41,42,43,44,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60,61,62,63,64,65,67,70,72,73,74,75,76,77,78,79,80,81,82,84,85,86,87,88,89,90 };
 21 | 
 22 | 
 23 | void sig_handler(int signo){
 24 |     if( signo == SIGINT ){
 25 |             printf("received SIGINT\n");
 26 |             signal_recieved = true;
 27 |     }
 28 | }
 29 | 
 30 | uint64_t current_timestamp() {
 31 |     struct timeval te; 
 32 |     gettimeofday(&te, NULL); // get current time
 33 |     return te.tv_sec*1000LL + te.tv_usec/1000; // caculate milliseconds
 34 | }
 35 | 
 36 | int main( int argc, char** argv )
 37 | {
 38 |     std::string model_file;
 39 |     std::string weights_file;
 40 |     std::string file_path;
 41 |     if(4 == argc){
 42 |         model_file = argv[1];
 43 |         weights_file = argv[2];
 44 |         file_path = argv[3];
 45 |     }
 46 |     else{
 47 |         LOG(ERROR) << "Input error: please input ./xx [model_path] [weights_path] [file_path]";
 48 |         return -1;
 49 |     }	
 50 | 
 51 |     //init network
 52 |     Detector detector = Detector(model_file,weights_file,0);
 53 | 
 54 |     std::vector<String> files;
 55 |     file_path = file_path + "/*.jpg";
 56 |     LOG(INFO) << "images dir path is " << file_path;
 57 |     glob(file_path,files,false);
 58 | 
 59 |     char* prefix = "../results";
 60 |     char* outfile = "coco_results";
 61 |     FILE *fp = 0;
 62 | 
 63 |     char buff1[1024];
 64 |     snprintf(buff1, 1024, "%s/%s.json", prefix, outfile);
 65 |     fp = fopen(buff1, "w");
 66 |     fprintf(fp, "[\n");
 67 | 
 68 |     for(int i=0;i<files.size();i++){
 69 |         LOG(INFO) <<"The " << i << " image path is " << files[i];
 70 | 
 71 |         size_t pos = files[i].find_last_of('/');
 72 |         std::string name(files[i].substr(pos+1));
 73 | 
 74 |         size_t pos1 = name.find_last_of('.');
 75 |         std::string id(name.substr(0,pos1));
 76 | 
 77 |         int image_id = stoi(id);
 78 |         LOG(INFO) << "image id is " << image_id;
 79 | 
 80 |         //load image with opencv
 81 |         Mat img = imread(files[i]);
 82 |         
 83 |         //detect
 84 |         float thresh = 0.0;
 85 |         std::vector<bbox_t> bbox_vec = detector.detect(img,thresh);
 86 | 
 87 |         //show detection results
 88 |         for (int i=0;i<bbox_vec.size();++i){
 89 |             bbox_t b = bbox_vec[i];
 90 |   
 91 |             float bx = b.x;
 92 |             float by = b.y;
 93 |             float bw = b.w;
 94 |             float bh = b.h;
 95 | 
 96 |             char buff2[1024];
 97 |             sprintf(buff2, "{\"image_id\":%d, \"category_id\":%d, \"bbox\":[%f, %f, %f, %f], \"score\":%f},\n", 
 98 |                 image_id, coco_ids[b.obj_id], bx, by, bw, bh, b.prob);
 99 |             fprintf(fp, buff2);
100 |             // LOG(INFO) << buff2;
101 |             // int left  = b.x;
102 |             // int right = b.x + b.w;
103 |             // int top   = b.y;
104 |             // int bot   = b.y + b.h;
105 |             // rectangle(img,Point(left,top),Point(right,bot),Scalar(0,0,255),3,8,0);
106 |         }
107 | 
108 |         //show with opencv
109 |         // namedWindow("show",CV_WINDOW_AUTOSIZE);
110 |         // imshow("show",img);
111 |         // waitKey(1);
112 |     }
113 |     fseek(fp, -2, SEEK_CUR); //x64
114 |     fprintf(fp, "\n]\n");
115 |     if (fp) fclose(fp);
116 | 
117 |     LOG(INFO) << "done.";
118 |     return 0;
119 | }
120 | 
121 | 


--------------------------------------------------------------------------------
/images/.ptp-sync-folder:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ChenYingpeng/caffe-yolov3/8db9e3882045a808ca391d61b1d13a9fa6df7fbd/images/.ptp-sync-folder


--------------------------------------------------------------------------------
/images/dog.jpg:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ChenYingpeng/caffe-yolov3/8db9e3882045a808ca391d61b1d13a9fa6df7fbd/images/dog.jpg


--------------------------------------------------------------------------------
/images/person.jpg:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/ChenYingpeng/caffe-yolov3/8db9e3882045a808ca391d61b1d13a9fa6df7fbd/images/person.jpg


--------------------------------------------------------------------------------
/prototxt/mobilenet_v1_yolov3.prototxt:
--------------------------------------------------------------------------------
   1 | name: "Darkent2Caffe"
   2 | input: "data"
   3 | input_dim: 1
   4 | input_dim: 3
   5 | input_dim: 416
   6 | input_dim: 416
   7 | 
   8 | layer {
   9 |     bottom: "data"
  10 |     top: "layer1-conv"
  11 |     name: "layer1-conv"
  12 |     type: "Convolution"
  13 |     convolution_param {
  14 |         num_output: 32
  15 |         kernel_size: 3
  16 |         pad: 1
  17 |         stride: 2
  18 |         bias_term: false
  19 |     }
  20 | }
  21 | layer {
  22 |     bottom: "layer1-conv"
  23 |     top: "layer1-conv"
  24 |     name: "layer1-bn"
  25 |     type: "BatchNorm"
  26 |     batch_norm_param {
  27 |         use_global_stats: true
  28 |     }
  29 | }
  30 | layer {
  31 |     bottom: "layer1-conv"
  32 |     top: "layer1-conv"
  33 |     name: "layer1-scale"
  34 |     type: "Scale"
  35 |     scale_param {
  36 |         bias_term: true
  37 |     }
  38 | }
  39 | layer {
  40 |     bottom: "layer1-conv"
  41 |     top: "layer1-conv"
  42 |     name: "layer1-act"
  43 |     type: "ReLU"
  44 |     relu_param {
  45 |         negative_slope: 0.1
  46 |     }
  47 | }
  48 | layer {
  49 |     bottom: "layer1-conv"
  50 |     top: "layer2-dwconv"
  51 |     name: "layer2-dwconv"
  52 |     type: "ConvolutionDepthwise"
  53 |     convolution_param {
  54 |         num_output: 32
  55 |         kernel_size: 3
  56 |         pad: 1
  57 |         stride: 1
  58 |         bias_term: false
  59 |     }
  60 | }
  61 | layer {
  62 |     bottom: "layer2-dwconv"
  63 |     top: "layer2-dwconv"
  64 |     name: "layer2-bn"
  65 |     type: "BatchNorm"
  66 |     batch_norm_param {
  67 |         use_global_stats: true
  68 |     }
  69 | }
  70 | layer {
  71 |     bottom: "layer2-dwconv"
  72 |     top: "layer2-dwconv"
  73 |     name: "layer2-scale"
  74 |     type: "Scale"
  75 |     scale_param {
  76 |         bias_term: true
  77 |     }
  78 | }
  79 | layer {
  80 |     bottom: "layer2-dwconv"
  81 |     top: "layer2-dwconv"
  82 |     name: "layer2-act"
  83 |     type: "ReLU"
  84 |     relu_param {
  85 |         negative_slope: 0.1
  86 |     }
  87 | }
  88 | layer {
  89 |     bottom: "layer2-dwconv"
  90 |     top: "layer3-conv"
  91 |     name: "layer3-conv"
  92 |     type: "Convolution"
  93 |     convolution_param {
  94 |         num_output: 64
  95 |         kernel_size: 1
  96 |         pad: 0
  97 |         stride: 1
  98 |         bias_term: false
  99 |     }
 100 | }
 101 | layer {
 102 |     bottom: "layer3-conv"
 103 |     top: "layer3-conv"
 104 |     name: "layer3-bn"
 105 |     type: "BatchNorm"
 106 |     batch_norm_param {
 107 |         use_global_stats: true
 108 |     }
 109 | }
 110 | layer {
 111 |     bottom: "layer3-conv"
 112 |     top: "layer3-conv"
 113 |     name: "layer3-scale"
 114 |     type: "Scale"
 115 |     scale_param {
 116 |         bias_term: true
 117 |     }
 118 | }
 119 | layer {
 120 |     bottom: "layer3-conv"
 121 |     top: "layer3-conv"
 122 |     name: "layer3-act"
 123 |     type: "ReLU"
 124 |     relu_param {
 125 |         negative_slope: 0.1
 126 |     }
 127 | }
 128 | layer {
 129 |     bottom: "layer3-conv"
 130 |     top: "layer4-dwconv"
 131 |     name: "layer4-dwconv"
 132 |     type: "ConvolutionDepthwise"
 133 |     convolution_param {
 134 |         num_output: 64
 135 |         kernel_size: 3
 136 |         pad: 1
 137 |         stride: 2
 138 |         bias_term: false
 139 |     }
 140 | }
 141 | layer {
 142 |     bottom: "layer4-dwconv"
 143 |     top: "layer4-dwconv"
 144 |     name: "layer4-bn"
 145 |     type: "BatchNorm"
 146 |     batch_norm_param {
 147 |         use_global_stats: true
 148 |     }
 149 | }
 150 | layer {
 151 |     bottom: "layer4-dwconv"
 152 |     top: "layer4-dwconv"
 153 |     name: "layer4-scale"
 154 |     type: "Scale"
 155 |     scale_param {
 156 |         bias_term: true
 157 |     }
 158 | }
 159 | layer {
 160 |     bottom: "layer4-dwconv"
 161 |     top: "layer4-dwconv"
 162 |     name: "layer4-act"
 163 |     type: "ReLU"
 164 |     relu_param {
 165 |         negative_slope: 0.1
 166 |     }
 167 | }
 168 | layer {
 169 |     bottom: "layer4-dwconv"
 170 |     top: "layer5-conv"
 171 |     name: "layer5-conv"
 172 |     type: "Convolution"
 173 |     convolution_param {
 174 |         num_output: 128
 175 |         kernel_size: 1
 176 |         pad: 0
 177 |         stride: 1
 178 |         bias_term: false
 179 |     }
 180 | }
 181 | layer {
 182 |     bottom: "layer5-conv"
 183 |     top: "layer5-conv"
 184 |     name: "layer5-bn"
 185 |     type: "BatchNorm"
 186 |     batch_norm_param {
 187 |         use_global_stats: true
 188 |     }
 189 | }
 190 | layer {
 191 |     bottom: "layer5-conv"
 192 |     top: "layer5-conv"
 193 |     name: "layer5-scale"
 194 |     type: "Scale"
 195 |     scale_param {
 196 |         bias_term: true
 197 |     }
 198 | }
 199 | layer {
 200 |     bottom: "layer5-conv"
 201 |     top: "layer5-conv"
 202 |     name: "layer5-act"
 203 |     type: "ReLU"
 204 |     relu_param {
 205 |         negative_slope: 0.1
 206 |     }
 207 | }
 208 | layer {
 209 |     bottom: "layer5-conv"
 210 |     top: "layer6-dwconv"
 211 |     name: "layer6-dwconv"
 212 |     type: "ConvolutionDepthwise"
 213 |     convolution_param {
 214 |         num_output: 128
 215 |         kernel_size: 3
 216 |         pad: 1
 217 |         stride: 1
 218 |         bias_term: false
 219 |     }
 220 | }
 221 | layer {
 222 |     bottom: "layer6-dwconv"
 223 |     top: "layer6-dwconv"
 224 |     name: "layer6-bn"
 225 |     type: "BatchNorm"
 226 |     batch_norm_param {
 227 |         use_global_stats: true
 228 |     }
 229 | }
 230 | layer {
 231 |     bottom: "layer6-dwconv"
 232 |     top: "layer6-dwconv"
 233 |     name: "layer6-scale"
 234 |     type: "Scale"
 235 |     scale_param {
 236 |         bias_term: true
 237 |     }
 238 | }
 239 | layer {
 240 |     bottom: "layer6-dwconv"
 241 |     top: "layer6-dwconv"
 242 |     name: "layer6-act"
 243 |     type: "ReLU"
 244 |     relu_param {
 245 |         negative_slope: 0.1
 246 |     }
 247 | }
 248 | layer {
 249 |     bottom: "layer6-dwconv"
 250 |     top: "layer7-conv"
 251 |     name: "layer7-conv"
 252 |     type: "Convolution"
 253 |     convolution_param {
 254 |         num_output: 128
 255 |         kernel_size: 1
 256 |         pad: 0
 257 |         stride: 1
 258 |         bias_term: false
 259 |     }
 260 | }
 261 | layer {
 262 |     bottom: "layer7-conv"
 263 |     top: "layer7-conv"
 264 |     name: "layer7-bn"
 265 |     type: "BatchNorm"
 266 |     batch_norm_param {
 267 |         use_global_stats: true
 268 |     }
 269 | }
 270 | layer {
 271 |     bottom: "layer7-conv"
 272 |     top: "layer7-conv"
 273 |     name: "layer7-scale"
 274 |     type: "Scale"
 275 |     scale_param {
 276 |         bias_term: true
 277 |     }
 278 | }
 279 | layer {
 280 |     bottom: "layer7-conv"
 281 |     top: "layer7-conv"
 282 |     name: "layer7-act"
 283 |     type: "ReLU"
 284 |     relu_param {
 285 |         negative_slope: 0.1
 286 |     }
 287 | }
 288 | layer {
 289 |     bottom: "layer7-conv"
 290 |     top: "layer8-dwconv"
 291 |     name: "layer8-dwconv"
 292 |     type: "ConvolutionDepthwise"
 293 |     convolution_param {
 294 |         num_output: 128
 295 |         kernel_size: 3
 296 |         pad: 1
 297 |         stride: 2
 298 |         bias_term: false
 299 |     }
 300 | }
 301 | layer {
 302 |     bottom: "layer8-dwconv"
 303 |     top: "layer8-dwconv"
 304 |     name: "layer8-bn"
 305 |     type: "BatchNorm"
 306 |     batch_norm_param {
 307 |         use_global_stats: true
 308 |     }
 309 | }
 310 | layer {
 311 |     bottom: "layer8-dwconv"
 312 |     top: "layer8-dwconv"
 313 |     name: "layer8-scale"
 314 |     type: "Scale"
 315 |     scale_param {
 316 |         bias_term: true
 317 |     }
 318 | }
 319 | layer {
 320 |     bottom: "layer8-dwconv"
 321 |     top: "layer8-dwconv"
 322 |     name: "layer8-act"
 323 |     type: "ReLU"
 324 |     relu_param {
 325 |         negative_slope: 0.1
 326 |     }
 327 | }
 328 | layer {
 329 |     bottom: "layer8-dwconv"
 330 |     top: "layer9-conv"
 331 |     name: "layer9-conv"
 332 |     type: "Convolution"
 333 |     convolution_param {
 334 |         num_output: 256
 335 |         kernel_size: 1
 336 |         pad: 0
 337 |         stride: 1
 338 |         bias_term: false
 339 |     }
 340 | }
 341 | layer {
 342 |     bottom: "layer9-conv"
 343 |     top: "layer9-conv"
 344 |     name: "layer9-bn"
 345 |     type: "BatchNorm"
 346 |     batch_norm_param {
 347 |         use_global_stats: true
 348 |     }
 349 | }
 350 | layer {
 351 |     bottom: "layer9-conv"
 352 |     top: "layer9-conv"
 353 |     name: "layer9-scale"
 354 |     type: "Scale"
 355 |     scale_param {
 356 |         bias_term: true
 357 |     }
 358 | }
 359 | layer {
 360 |     bottom: "layer9-conv"
 361 |     top: "layer9-conv"
 362 |     name: "layer9-act"
 363 |     type: "ReLU"
 364 |     relu_param {
 365 |         negative_slope: 0.1
 366 |     }
 367 | }
 368 | layer {
 369 |     bottom: "layer9-conv"
 370 |     top: "layer10-dwconv"
 371 |     name: "layer10-dwconv"
 372 |     type: "ConvolutionDepthwise"
 373 |     convolution_param {
 374 |         num_output: 256
 375 |         kernel_size: 3
 376 |         pad: 1
 377 |         stride: 1
 378 |         bias_term: false
 379 |     }
 380 | }
 381 | layer {
 382 |     bottom: "layer10-dwconv"
 383 |     top: "layer10-dwconv"
 384 |     name: "layer10-bn"
 385 |     type: "BatchNorm"
 386 |     batch_norm_param {
 387 |         use_global_stats: true
 388 |     }
 389 | }
 390 | layer {
 391 |     bottom: "layer10-dwconv"
 392 |     top: "layer10-dwconv"
 393 |     name: "layer10-scale"
 394 |     type: "Scale"
 395 |     scale_param {
 396 |         bias_term: true
 397 |     }
 398 | }
 399 | layer {
 400 |     bottom: "layer10-dwconv"
 401 |     top: "layer10-dwconv"
 402 |     name: "layer10-act"
 403 |     type: "ReLU"
 404 |     relu_param {
 405 |         negative_slope: 0.1
 406 |     }
 407 | }
 408 | layer {
 409 |     bottom: "layer10-dwconv"
 410 |     top: "layer11-conv"
 411 |     name: "layer11-conv"
 412 |     type: "Convolution"
 413 |     convolution_param {
 414 |         num_output: 256
 415 |         kernel_size: 1
 416 |         pad: 0
 417 |         stride: 1
 418 |         bias_term: false
 419 |     }
 420 | }
 421 | layer {
 422 |     bottom: "layer11-conv"
 423 |     top: "layer11-conv"
 424 |     name: "layer11-bn"
 425 |     type: "BatchNorm"
 426 |     batch_norm_param {
 427 |         use_global_stats: true
 428 |     }
 429 | }
 430 | layer {
 431 |     bottom: "layer11-conv"
 432 |     top: "layer11-conv"
 433 |     name: "layer11-scale"
 434 |     type: "Scale"
 435 |     scale_param {
 436 |         bias_term: true
 437 |     }
 438 | }
 439 | layer {
 440 |     bottom: "layer11-conv"
 441 |     top: "layer11-conv"
 442 |     name: "layer11-act"
 443 |     type: "ReLU"
 444 |     relu_param {
 445 |         negative_slope: 0.1
 446 |     }
 447 | }
 448 | layer {
 449 |     bottom: "layer11-conv"
 450 |     top: "layer12-dwconv"
 451 |     name: "layer12-dwconv"
 452 |     type: "ConvolutionDepthwise"
 453 |     convolution_param {
 454 |         num_output: 256
 455 |         kernel_size: 3
 456 |         pad: 1
 457 |         stride: 2
 458 |         bias_term: false
 459 |     }
 460 | }
 461 | layer {
 462 |     bottom: "layer12-dwconv"
 463 |     top: "layer12-dwconv"
 464 |     name: "layer12-bn"
 465 |     type: "BatchNorm"
 466 |     batch_norm_param {
 467 |         use_global_stats: true
 468 |     }
 469 | }
 470 | layer {
 471 |     bottom: "layer12-dwconv"
 472 |     top: "layer12-dwconv"
 473 |     name: "layer12-scale"
 474 |     type: "Scale"
 475 |     scale_param {
 476 |         bias_term: true
 477 |     }
 478 | }
 479 | layer {
 480 |     bottom: "layer12-dwconv"
 481 |     top: "layer12-dwconv"
 482 |     name: "layer12-act"
 483 |     type: "ReLU"
 484 |     relu_param {
 485 |         negative_slope: 0.1
 486 |     }
 487 | }
 488 | layer {
 489 |     bottom: "layer12-dwconv"
 490 |     top: "layer13-conv"
 491 |     name: "layer13-conv"
 492 |     type: "Convolution"
 493 |     convolution_param {
 494 |         num_output: 512
 495 |         kernel_size: 1
 496 |         pad: 0
 497 |         stride: 1
 498 |         bias_term: false
 499 |     }
 500 | }
 501 | layer {
 502 |     bottom: "layer13-conv"
 503 |     top: "layer13-conv"
 504 |     name: "layer13-bn"
 505 |     type: "BatchNorm"
 506 |     batch_norm_param {
 507 |         use_global_stats: true
 508 |     }
 509 | }
 510 | layer {
 511 |     bottom: "layer13-conv"
 512 |     top: "layer13-conv"
 513 |     name: "layer13-scale"
 514 |     type: "Scale"
 515 |     scale_param {
 516 |         bias_term: true
 517 |     }
 518 | }
 519 | layer {
 520 |     bottom: "layer13-conv"
 521 |     top: "layer13-conv"
 522 |     name: "layer13-act"
 523 |     type: "ReLU"
 524 |     relu_param {
 525 |         negative_slope: 0.1
 526 |     }
 527 | }
 528 | layer {
 529 |     bottom: "layer13-conv"
 530 |     top: "layer14-dwconv"
 531 |     name: "layer14-dwconv"
 532 |     type: "ConvolutionDepthwise"
 533 |     convolution_param {
 534 |         num_output: 512
 535 |         kernel_size: 3
 536 |         pad: 1
 537 |         stride: 1
 538 |         bias_term: false
 539 |     }
 540 | }
 541 | layer {
 542 |     bottom: "layer14-dwconv"
 543 |     top: "layer14-dwconv"
 544 |     name: "layer14-bn"
 545 |     type: "BatchNorm"
 546 |     batch_norm_param {
 547 |         use_global_stats: true
 548 |     }
 549 | }
 550 | layer {
 551 |     bottom: "layer14-dwconv"
 552 |     top: "layer14-dwconv"
 553 |     name: "layer14-scale"
 554 |     type: "Scale"
 555 |     scale_param {
 556 |         bias_term: true
 557 |     }
 558 | }
 559 | layer {
 560 |     bottom: "layer14-dwconv"
 561 |     top: "layer14-dwconv"
 562 |     name: "layer14-act"
 563 |     type: "ReLU"
 564 |     relu_param {
 565 |         negative_slope: 0.1
 566 |     }
 567 | }
 568 | layer {
 569 |     bottom: "layer14-dwconv"
 570 |     top: "layer15-conv"
 571 |     name: "layer15-conv"
 572 |     type: "Convolution"
 573 |     convolution_param {
 574 |         num_output: 512
 575 |         kernel_size: 1
 576 |         pad: 0
 577 |         stride: 1
 578 |         bias_term: false
 579 |     }
 580 | }
 581 | layer {
 582 |     bottom: "layer15-conv"
 583 |     top: "layer15-conv"
 584 |     name: "layer15-bn"
 585 |     type: "BatchNorm"
 586 |     batch_norm_param {
 587 |         use_global_stats: true
 588 |     }
 589 | }
 590 | layer {
 591 |     bottom: "layer15-conv"
 592 |     top: "layer15-conv"
 593 |     name: "layer15-scale"
 594 |     type: "Scale"
 595 |     scale_param {
 596 |         bias_term: true
 597 |     }
 598 | }
 599 | layer {
 600 |     bottom: "layer15-conv"
 601 |     top: "layer15-conv"
 602 |     name: "layer15-act"
 603 |     type: "ReLU"
 604 |     relu_param {
 605 |         negative_slope: 0.1
 606 |     }
 607 | }
 608 | layer {
 609 |     bottom: "layer15-conv"
 610 |     top: "layer16-dwconv"
 611 |     name: "layer16-dwconv"
 612 |     type: "ConvolutionDepthwise"
 613 |     convolution_param {
 614 |         num_output: 512
 615 |         kernel_size: 3
 616 |         pad: 1
 617 |         stride: 1
 618 |         bias_term: false
 619 |     }
 620 | }
 621 | layer {
 622 |     bottom: "layer16-dwconv"
 623 |     top: "layer16-dwconv"
 624 |     name: "layer16-bn"
 625 |     type: "BatchNorm"
 626 |     batch_norm_param {
 627 |         use_global_stats: true
 628 |     }
 629 | }
 630 | layer {
 631 |     bottom: "layer16-dwconv"
 632 |     top: "layer16-dwconv"
 633 |     name: "layer16-scale"
 634 |     type: "Scale"
 635 |     scale_param {
 636 |         bias_term: true
 637 |     }
 638 | }
 639 | layer {
 640 |     bottom: "layer16-dwconv"
 641 |     top: "layer16-dwconv"
 642 |     name: "layer16-act"
 643 |     type: "ReLU"
 644 |     relu_param {
 645 |         negative_slope: 0.1
 646 |     }
 647 | }
 648 | layer {
 649 |     bottom: "layer16-dwconv"
 650 |     top: "layer17-conv"
 651 |     name: "layer17-conv"
 652 |     type: "Convolution"
 653 |     convolution_param {
 654 |         num_output: 512
 655 |         kernel_size: 1
 656 |         pad: 0
 657 |         stride: 1
 658 |         bias_term: false
 659 |     }
 660 | }
 661 | layer {
 662 |     bottom: "layer17-conv"
 663 |     top: "layer17-conv"
 664 |     name: "layer17-bn"
 665 |     type: "BatchNorm"
 666 |     batch_norm_param {
 667 |         use_global_stats: true
 668 |     }
 669 | }
 670 | layer {
 671 |     bottom: "layer17-conv"
 672 |     top: "layer17-conv"
 673 |     name: "layer17-scale"
 674 |     type: "Scale"
 675 |     scale_param {
 676 |         bias_term: true
 677 |     }
 678 | }
 679 | layer {
 680 |     bottom: "layer17-conv"
 681 |     top: "layer17-conv"
 682 |     name: "layer17-act"
 683 |     type: "ReLU"
 684 |     relu_param {
 685 |         negative_slope: 0.1
 686 |     }
 687 | }
 688 | layer {
 689 |     bottom: "layer17-conv"
 690 |     top: "layer18-dwconv"
 691 |     name: "layer18-dwconv"
 692 |     type: "ConvolutionDepthwise"
 693 |     convolution_param {
 694 |         num_output: 512
 695 |         kernel_size: 3
 696 |         pad: 1
 697 |         stride: 1
 698 |         bias_term: false
 699 |     }
 700 | }
 701 | layer {
 702 |     bottom: "layer18-dwconv"
 703 |     top: "layer18-dwconv"
 704 |     name: "layer18-bn"
 705 |     type: "BatchNorm"
 706 |     batch_norm_param {
 707 |         use_global_stats: true
 708 |     }
 709 | }
 710 | layer {
 711 |     bottom: "layer18-dwconv"
 712 |     top: "layer18-dwconv"
 713 |     name: "layer18-scale"
 714 |     type: "Scale"
 715 |     scale_param {
 716 |         bias_term: true
 717 |     }
 718 | }
 719 | layer {
 720 |     bottom: "layer18-dwconv"
 721 |     top: "layer18-dwconv"
 722 |     name: "layer18-act"
 723 |     type: "ReLU"
 724 |     relu_param {
 725 |         negative_slope: 0.1
 726 |     }
 727 | }
 728 | layer {
 729 |     bottom: "layer18-dwconv"
 730 |     top: "layer19-conv"
 731 |     name: "layer19-conv"
 732 |     type: "Convolution"
 733 |     convolution_param {
 734 |         num_output: 512
 735 |         kernel_size: 1
 736 |         pad: 0
 737 |         stride: 1
 738 |         bias_term: false
 739 |     }
 740 | }
 741 | layer {
 742 |     bottom: "layer19-conv"
 743 |     top: "layer19-conv"
 744 |     name: "layer19-bn"
 745 |     type: "BatchNorm"
 746 |     batch_norm_param {
 747 |         use_global_stats: true
 748 |     }
 749 | }
 750 | layer {
 751 |     bottom: "layer19-conv"
 752 |     top: "layer19-conv"
 753 |     name: "layer19-scale"
 754 |     type: "Scale"
 755 |     scale_param {
 756 |         bias_term: true
 757 |     }
 758 | }
 759 | layer {
 760 |     bottom: "layer19-conv"
 761 |     top: "layer19-conv"
 762 |     name: "layer19-act"
 763 |     type: "ReLU"
 764 |     relu_param {
 765 |         negative_slope: 0.1
 766 |     }
 767 | }
 768 | layer {
 769 |     bottom: "layer19-conv"
 770 |     top: "layer20-dwconv"
 771 |     name: "layer20-dwconv"
 772 |     type: "ConvolutionDepthwise"
 773 |     convolution_param {
 774 |         num_output: 512
 775 |         kernel_size: 3
 776 |         pad: 1
 777 |         stride: 1
 778 |         bias_term: false
 779 |     }
 780 | }
 781 | layer {
 782 |     bottom: "layer20-dwconv"
 783 |     top: "layer20-dwconv"
 784 |     name: "layer20-bn"
 785 |     type: "BatchNorm"
 786 |     batch_norm_param {
 787 |         use_global_stats: true
 788 |     }
 789 | }
 790 | layer {
 791 |     bottom: "layer20-dwconv"
 792 |     top: "layer20-dwconv"
 793 |     name: "layer20-scale"
 794 |     type: "Scale"
 795 |     scale_param {
 796 |         bias_term: true
 797 |     }
 798 | }
 799 | layer {
 800 |     bottom: "layer20-dwconv"
 801 |     top: "layer20-dwconv"
 802 |     name: "layer20-act"
 803 |     type: "ReLU"
 804 |     relu_param {
 805 |         negative_slope: 0.1
 806 |     }
 807 | }
 808 | layer {
 809 |     bottom: "layer20-dwconv"
 810 |     top: "layer21-conv"
 811 |     name: "layer21-conv"
 812 |     type: "Convolution"
 813 |     convolution_param {
 814 |         num_output: 512
 815 |         kernel_size: 1
 816 |         pad: 0
 817 |         stride: 1
 818 |         bias_term: false
 819 |     }
 820 | }
 821 | layer {
 822 |     bottom: "layer21-conv"
 823 |     top: "layer21-conv"
 824 |     name: "layer21-bn"
 825 |     type: "BatchNorm"
 826 |     batch_norm_param {
 827 |         use_global_stats: true
 828 |     }
 829 | }
 830 | layer {
 831 |     bottom: "layer21-conv"
 832 |     top: "layer21-conv"
 833 |     name: "layer21-scale"
 834 |     type: "Scale"
 835 |     scale_param {
 836 |         bias_term: true
 837 |     }
 838 | }
 839 | layer {
 840 |     bottom: "layer21-conv"
 841 |     top: "layer21-conv"
 842 |     name: "layer21-act"
 843 |     type: "ReLU"
 844 |     relu_param {
 845 |         negative_slope: 0.1
 846 |     }
 847 | }
 848 | layer {
 849 |     bottom: "layer21-conv"
 850 |     top: "layer22-dwconv"
 851 |     name: "layer22-dwconv"
 852 |     type: "ConvolutionDepthwise"
 853 |     convolution_param {
 854 |         num_output: 512
 855 |         kernel_size: 3
 856 |         pad: 1
 857 |         stride: 1
 858 |         bias_term: false
 859 |     }
 860 | }
 861 | layer {
 862 |     bottom: "layer22-dwconv"
 863 |     top: "layer22-dwconv"
 864 |     name: "layer22-bn"
 865 |     type: "BatchNorm"
 866 |     batch_norm_param {
 867 |         use_global_stats: true
 868 |     }
 869 | }
 870 | layer {
 871 |     bottom: "layer22-dwconv"
 872 |     top: "layer22-dwconv"
 873 |     name: "layer22-scale"
 874 |     type: "Scale"
 875 |     scale_param {
 876 |         bias_term: true
 877 |     }
 878 | }
 879 | layer {
 880 |     bottom: "layer22-dwconv"
 881 |     top: "layer22-dwconv"
 882 |     name: "layer22-act"
 883 |     type: "ReLU"
 884 |     relu_param {
 885 |         negative_slope: 0.1
 886 |     }
 887 | }
 888 | layer {
 889 |     bottom: "layer22-dwconv"
 890 |     top: "layer23-conv"
 891 |     name: "layer23-conv"
 892 |     type: "Convolution"
 893 |     convolution_param {
 894 |         num_output: 512
 895 |         kernel_size: 1
 896 |         pad: 0
 897 |         stride: 1
 898 |         bias_term: false
 899 |     }
 900 | }
 901 | layer {
 902 |     bottom: "layer23-conv"
 903 |     top: "layer23-conv"
 904 |     name: "layer23-bn"
 905 |     type: "BatchNorm"
 906 |     batch_norm_param {
 907 |         use_global_stats: true
 908 |     }
 909 | }
 910 | layer {
 911 |     bottom: "layer23-conv"
 912 |     top: "layer23-conv"
 913 |     name: "layer23-scale"
 914 |     type: "Scale"
 915 |     scale_param {
 916 |         bias_term: true
 917 |     }
 918 | }
 919 | layer {
 920 |     bottom: "layer23-conv"
 921 |     top: "layer23-conv"
 922 |     name: "layer23-act"
 923 |     type: "ReLU"
 924 |     relu_param {
 925 |         negative_slope: 0.1
 926 |     }
 927 | }
 928 | layer {
 929 |     bottom: "layer23-conv"
 930 |     top: "layer24-dwconv"
 931 |     name: "layer24-dwconv"
 932 |     type: "ConvolutionDepthwise"
 933 |     convolution_param {
 934 |         num_output: 512
 935 |         kernel_size: 3
 936 |         pad: 1
 937 |         stride: 2
 938 |         bias_term: false
 939 |     }
 940 | }
 941 | layer {
 942 |     bottom: "layer24-dwconv"
 943 |     top: "layer24-dwconv"
 944 |     name: "layer24-bn"
 945 |     type: "BatchNorm"
 946 |     batch_norm_param {
 947 |         use_global_stats: true
 948 |     }
 949 | }
 950 | layer {
 951 |     bottom: "layer24-dwconv"
 952 |     top: "layer24-dwconv"
 953 |     name: "layer24-scale"
 954 |     type: "Scale"
 955 |     scale_param {
 956 |         bias_term: true
 957 |     }
 958 | }
 959 | layer {
 960 |     bottom: "layer24-dwconv"
 961 |     top: "layer24-dwconv"
 962 |     name: "layer24-act"
 963 |     type: "ReLU"
 964 |     relu_param {
 965 |         negative_slope: 0.1
 966 |     }
 967 | }
 968 | layer {
 969 |     bottom: "layer24-dwconv"
 970 |     top: "layer25-conv"
 971 |     name: "layer25-conv"
 972 |     type: "Convolution"
 973 |     convolution_param {
 974 |         num_output: 1024
 975 |         kernel_size: 1
 976 |         pad: 0
 977 |         stride: 1
 978 |         bias_term: false
 979 |     }
 980 | }
 981 | layer {
 982 |     bottom: "layer25-conv"
 983 |     top: "layer25-conv"
 984 |     name: "layer25-bn"
 985 |     type: "BatchNorm"
 986 |     batch_norm_param {
 987 |         use_global_stats: true
 988 |     }
 989 | }
 990 | layer {
 991 |     bottom: "layer25-conv"
 992 |     top: "layer25-conv"
 993 |     name: "layer25-scale"
 994 |     type: "Scale"
 995 |     scale_param {
 996 |         bias_term: true
 997 |     }
 998 | }
 999 | layer {
1000 |     bottom: "layer25-conv"
1001 |     top: "layer25-conv"
1002 |     name: "layer25-act"
1003 |     type: "ReLU"
1004 |     relu_param {
1005 |         negative_slope: 0.1
1006 |     }
1007 | }
1008 | layer {
1009 |     bottom: "layer25-conv"
1010 |     top: "layer26-dwconv"
1011 |     name: "layer26-dwconv"
1012 |     type: "ConvolutionDepthwise"
1013 |     convolution_param {
1014 |         num_output: 1024
1015 |         kernel_size: 3
1016 |         pad: 1
1017 |         stride: 1
1018 |         bias_term: false
1019 |     }
1020 | }
1021 | layer {
1022 |     bottom: "layer26-dwconv"
1023 |     top: "layer26-dwconv"
1024 |     name: "layer26-bn"
1025 |     type: "BatchNorm"
1026 |     batch_norm_param {
1027 |         use_global_stats: true
1028 |     }
1029 | }
1030 | layer {
1031 |     bottom: "layer26-dwconv"
1032 |     top: "layer26-dwconv"
1033 |     name: "layer26-scale"
1034 |     type: "Scale"
1035 |     scale_param {
1036 |         bias_term: true
1037 |     }
1038 | }
1039 | layer {
1040 |     bottom: "layer26-dwconv"
1041 |     top: "layer26-dwconv"
1042 |     name: "layer26-act"
1043 |     type: "ReLU"
1044 |     relu_param {
1045 |         negative_slope: 0.1
1046 |     }
1047 | }
1048 | layer {
1049 |     bottom: "layer26-dwconv"
1050 |     top: "layer27-conv"
1051 |     name: "layer27-conv"
1052 |     type: "Convolution"
1053 |     convolution_param {
1054 |         num_output: 1024
1055 |         kernel_size: 1
1056 |         pad: 0
1057 |         stride: 1
1058 |         bias_term: false
1059 |     }
1060 | }
1061 | layer {
1062 |     bottom: "layer27-conv"
1063 |     top: "layer27-conv"
1064 |     name: "layer27-bn"
1065 |     type: "BatchNorm"
1066 |     batch_norm_param {
1067 |         use_global_stats: true
1068 |     }
1069 | }
1070 | layer {
1071 |     bottom: "layer27-conv"
1072 |     top: "layer27-conv"
1073 |     name: "layer27-scale"
1074 |     type: "Scale"
1075 |     scale_param {
1076 |         bias_term: true
1077 |     }
1078 | }
1079 | layer {
1080 |     bottom: "layer27-conv"
1081 |     top: "layer27-conv"
1082 |     name: "layer27-act"
1083 |     type: "ReLU"
1084 |     relu_param {
1085 |         negative_slope: 0.1
1086 |     }
1087 | }
1088 | layer {
1089 |     bottom: "layer27-conv"
1090 |     top: "layer28-conv"
1091 |     name: "layer28-conv"
1092 |     type: "Convolution"
1093 |     convolution_param {
1094 |         num_output: 512
1095 |         kernel_size: 1
1096 |         pad: 0
1097 |         stride: 1
1098 |         bias_term: false
1099 |     }
1100 | }
1101 | layer {
1102 |     bottom: "layer28-conv"
1103 |     top: "layer28-conv"
1104 |     name: "layer28-bn"
1105 |     type: "BatchNorm"
1106 |     batch_norm_param {
1107 |         use_global_stats: true
1108 |     }
1109 | }
1110 | layer {
1111 |     bottom: "layer28-conv"
1112 |     top: "layer28-conv"
1113 |     name: "layer28-scale"
1114 |     type: "Scale"
1115 |     scale_param {
1116 |         bias_term: true
1117 |     }
1118 | }
1119 | layer {
1120 |     bottom: "layer28-conv"
1121 |     top: "layer28-conv"
1122 |     name: "layer28-act"
1123 |     type: "ReLU"
1124 |     relu_param {
1125 |         negative_slope: 0.1
1126 |     }
1127 | }
1128 | layer {
1129 |     bottom: "layer28-conv"
1130 |     top: "layer29-conv"
1131 |     name: "layer29-conv"
1132 |     type: "Convolution"
1133 |     convolution_param {
1134 |         num_output: 1024
1135 |         kernel_size: 3
1136 |         pad: 1
1137 |         stride: 1
1138 |         bias_term: false
1139 |     }
1140 | }
1141 | layer {
1142 |     bottom: "layer29-conv"
1143 |     top: "layer29-conv"
1144 |     name: "layer29-bn"
1145 |     type: "BatchNorm"
1146 |     batch_norm_param {
1147 |         use_global_stats: true
1148 |     }
1149 | }
1150 | layer {
1151 |     bottom: "layer29-conv"
1152 |     top: "layer29-conv"
1153 |     name: "layer29-scale"
1154 |     type: "Scale"
1155 |     scale_param {
1156 |         bias_term: true
1157 |     }
1158 | }
1159 | layer {
1160 |     bottom: "layer29-conv"
1161 |     top: "layer29-conv"
1162 |     name: "layer29-act"
1163 |     type: "ReLU"
1164 |     relu_param {
1165 |         negative_slope: 0.1
1166 |     }
1167 | }
1168 | layer {
1169 |     bottom: "layer29-conv"
1170 |     top: "layer30-conv"
1171 |     name: "layer30-conv"
1172 |     type: "Convolution"
1173 |     convolution_param {
1174 |         num_output: 512
1175 |         kernel_size: 1
1176 |         pad: 0
1177 |         stride: 1
1178 |         bias_term: false
1179 |     }
1180 | }
1181 | layer {
1182 |     bottom: "layer30-conv"
1183 |     top: "layer30-conv"
1184 |     name: "layer30-bn"
1185 |     type: "BatchNorm"
1186 |     batch_norm_param {
1187 |         use_global_stats: true
1188 |     }
1189 | }
1190 | layer {
1191 |     bottom: "layer30-conv"
1192 |     top: "layer30-conv"
1193 |     name: "layer30-scale"
1194 |     type: "Scale"
1195 |     scale_param {
1196 |         bias_term: true
1197 |     }
1198 | }
1199 | layer {
1200 |     bottom: "layer30-conv"
1201 |     top: "layer30-conv"
1202 |     name: "layer30-act"
1203 |     type: "ReLU"
1204 |     relu_param {
1205 |         negative_slope: 0.1
1206 |     }
1207 | }
1208 | layer {
1209 |     bottom: "layer30-conv"
1210 |     top: "layer31-conv"
1211 |     name: "layer31-conv"
1212 |     type: "Convolution"
1213 |     convolution_param {
1214 |         num_output: 1024
1215 |         kernel_size: 3
1216 |         pad: 1
1217 |         stride: 1
1218 |         bias_term: false
1219 |     }
1220 | }
1221 | layer {
1222 |     bottom: "layer31-conv"
1223 |     top: "layer31-conv"
1224 |     name: "layer31-bn"
1225 |     type: "BatchNorm"
1226 |     batch_norm_param {
1227 |         use_global_stats: true
1228 |     }
1229 | }
1230 | layer {
1231 |     bottom: "layer31-conv"
1232 |     top: "layer31-conv"
1233 |     name: "layer31-scale"
1234 |     type: "Scale"
1235 |     scale_param {
1236 |         bias_term: true
1237 |     }
1238 | }
1239 | layer {
1240 |     bottom: "layer31-conv"
1241 |     top: "layer31-conv"
1242 |     name: "layer31-act"
1243 |     type: "ReLU"
1244 |     relu_param {
1245 |         negative_slope: 0.1
1246 |     }
1247 | }
1248 | layer {
1249 |     bottom: "layer31-conv"
1250 |     top: "layer32-conv"
1251 |     name: "layer32-conv"
1252 |     type: "Convolution"
1253 |     convolution_param {
1254 |         num_output: 512
1255 |         kernel_size: 1
1256 |         pad: 0
1257 |         stride: 1
1258 |         bias_term: false
1259 |     }
1260 | }
1261 | layer {
1262 |     bottom: "layer32-conv"
1263 |     top: "layer32-conv"
1264 |     name: "layer32-bn"
1265 |     type: "BatchNorm"
1266 |     batch_norm_param {
1267 |         use_global_stats: true
1268 |     }
1269 | }
1270 | layer {
1271 |     bottom: "layer32-conv"
1272 |     top: "layer32-conv"
1273 |     name: "layer32-scale"
1274 |     type: "Scale"
1275 |     scale_param {
1276 |         bias_term: true
1277 |     }
1278 | }
1279 | layer {
1280 |     bottom: "layer32-conv"
1281 |     top: "layer32-conv"
1282 |     name: "layer32-act"
1283 |     type: "ReLU"
1284 |     relu_param {
1285 |         negative_slope: 0.1
1286 |     }
1287 | }
1288 | layer {
1289 |     bottom: "layer32-conv"
1290 |     top: "layer33-conv"
1291 |     name: "layer33-conv"
1292 |     type: "Convolution"
1293 |     convolution_param {
1294 |         num_output: 1024
1295 |         kernel_size: 3
1296 |         pad: 1
1297 |         stride: 1
1298 |         bias_term: false
1299 |     }
1300 | }
1301 | layer {
1302 |     bottom: "layer33-conv"
1303 |     top: "layer33-conv"
1304 |     name: "layer33-bn"
1305 |     type: "BatchNorm"
1306 |     batch_norm_param {
1307 |         use_global_stats: true
1308 |     }
1309 | }
1310 | layer {
1311 |     bottom: "layer33-conv"
1312 |     top: "layer33-conv"
1313 |     name: "layer33-scale"
1314 |     type: "Scale"
1315 |     scale_param {
1316 |         bias_term: true
1317 |     }
1318 | }
1319 | layer {
1320 |     bottom: "layer33-conv"
1321 |     top: "layer33-conv"
1322 |     name: "layer33-act"
1323 |     type: "ReLU"
1324 |     relu_param {
1325 |         negative_slope: 0.1
1326 |     }
1327 | }
1328 | layer {
1329 |     bottom: "layer33-conv"
1330 |     top: "layer34-conv"
1331 |     name: "layer34-conv"
1332 |     type: "Convolution"
1333 |     convolution_param {
1334 |         num_output: 255
1335 |         kernel_size: 1
1336 |         pad: 0
1337 |         stride: 1
1338 |         bias_term: true
1339 |     }
1340 | }
1341 | layer {
1342 |     bottom: "layer32-conv"
1343 |     top: "layer36-route"
1344 |     name: "layer36-route"
1345 |     type: "Concat"
1346 | }
1347 | layer {
1348 |     bottom: "layer36-route"
1349 |     top: "layer37-conv"
1350 |     name: "layer37-conv"
1351 |     type: "Convolution"
1352 |     convolution_param {
1353 |         num_output: 256
1354 |         kernel_size: 1
1355 |         pad: 0
1356 |         stride: 1
1357 |         bias_term: false
1358 |     }
1359 | }
1360 | layer {
1361 |     bottom: "layer37-conv"
1362 |     top: "layer37-conv"
1363 |     name: "layer37-bn"
1364 |     type: "BatchNorm"
1365 |     batch_norm_param {
1366 |         use_global_stats: true
1367 |     }
1368 | }
1369 | layer {
1370 |     bottom: "layer37-conv"
1371 |     top: "layer37-conv"
1372 |     name: "layer37-scale"
1373 |     type: "Scale"
1374 |     scale_param {
1375 |         bias_term: true
1376 |     }
1377 | }
1378 | layer {
1379 |     bottom: "layer37-conv"
1380 |     top: "layer37-conv"
1381 |     name: "layer37-act"
1382 |     type: "ReLU"
1383 |     relu_param {
1384 |         negative_slope: 0.1
1385 |     }
1386 | }
1387 | layer {
1388 |     bottom: "layer37-conv"
1389 |     top: "layer38-upsample"
1390 |     name: "layer38-upsample"
1391 |     type: "Upsample"
1392 |     upsample_param {
1393 |         scale: 2
1394 |     }
1395 | }
1396 | layer {
1397 |     bottom: "layer38-upsample"
1398 |     bottom: "layer23-conv"
1399 |     top: "layer39-route"
1400 |     name: "layer39-route"
1401 |     type: "Concat"
1402 | }
1403 | layer {
1404 |     bottom: "layer39-route"
1405 |     top: "layer40-conv"
1406 |     name: "layer40-conv"
1407 |     type: "Convolution"
1408 |     convolution_param {
1409 |         num_output: 256
1410 |         kernel_size: 1
1411 |         pad: 0
1412 |         stride: 1
1413 |         bias_term: false
1414 |     }
1415 | }
1416 | layer {
1417 |     bottom: "layer40-conv"
1418 |     top: "layer40-conv"
1419 |     name: "layer40-bn"
1420 |     type: "BatchNorm"
1421 |     batch_norm_param {
1422 |         use_global_stats: true
1423 |     }
1424 | }
1425 | layer {
1426 |     bottom: "layer40-conv"
1427 |     top: "layer40-conv"
1428 |     name: "layer40-scale"
1429 |     type: "Scale"
1430 |     scale_param {
1431 |         bias_term: true
1432 |     }
1433 | }
1434 | layer {
1435 |     bottom: "layer40-conv"
1436 |     top: "layer40-conv"
1437 |     name: "layer40-act"
1438 |     type: "ReLU"
1439 |     relu_param {
1440 |         negative_slope: 0.1
1441 |     }
1442 | }
1443 | layer {
1444 |     bottom: "layer40-conv"
1445 |     top: "layer41-conv"
1446 |     name: "layer41-conv"
1447 |     type: "Convolution"
1448 |     convolution_param {
1449 |         num_output: 512
1450 |         kernel_size: 3
1451 |         pad: 1
1452 |         stride: 1
1453 |         bias_term: false
1454 |     }
1455 | }
1456 | layer {
1457 |     bottom: "layer41-conv"
1458 |     top: "layer41-conv"
1459 |     name: "layer41-bn"
1460 |     type: "BatchNorm"
1461 |     batch_norm_param {
1462 |         use_global_stats: true
1463 |     }
1464 | }
1465 | layer {
1466 |     bottom: "layer41-conv"
1467 |     top: "layer41-conv"
1468 |     name: "layer41-scale"
1469 |     type: "Scale"
1470 |     scale_param {
1471 |         bias_term: true
1472 |     }
1473 | }
1474 | layer {
1475 |     bottom: "layer41-conv"
1476 |     top: "layer41-conv"
1477 |     name: "layer41-act"
1478 |     type: "ReLU"
1479 |     relu_param {
1480 |         negative_slope: 0.1
1481 |     }
1482 | }
1483 | layer {
1484 |     bottom: "layer41-conv"
1485 |     top: "layer42-conv"
1486 |     name: "layer42-conv"
1487 |     type: "Convolution"
1488 |     convolution_param {
1489 |         num_output: 256
1490 |         kernel_size: 1
1491 |         pad: 0
1492 |         stride: 1
1493 |         bias_term: false
1494 |     }
1495 | }
1496 | layer {
1497 |     bottom: "layer42-conv"
1498 |     top: "layer42-conv"
1499 |     name: "layer42-bn"
1500 |     type: "BatchNorm"
1501 |     batch_norm_param {
1502 |         use_global_stats: true
1503 |     }
1504 | }
1505 | layer {
1506 |     bottom: "layer42-conv"
1507 |     top: "layer42-conv"
1508 |     name: "layer42-scale"
1509 |     type: "Scale"
1510 |     scale_param {
1511 |         bias_term: true
1512 |     }
1513 | }
1514 | layer {
1515 |     bottom: "layer42-conv"
1516 |     top: "layer42-conv"
1517 |     name: "layer42-act"
1518 |     type: "ReLU"
1519 |     relu_param {
1520 |         negative_slope: 0.1
1521 |     }
1522 | }
1523 | layer {
1524 |     bottom: "layer42-conv"
1525 |     top: "layer43-conv"
1526 |     name: "layer43-conv"
1527 |     type: "Convolution"
1528 |     convolution_param {
1529 |         num_output: 512
1530 |         kernel_size: 3
1531 |         pad: 1
1532 |         stride: 1
1533 |         bias_term: false
1534 |     }
1535 | }
1536 | layer {
1537 |     bottom: "layer43-conv"
1538 |     top: "layer43-conv"
1539 |     name: "layer43-bn"
1540 |     type: "BatchNorm"
1541 |     batch_norm_param {
1542 |         use_global_stats: true
1543 |     }
1544 | }
1545 | layer {
1546 |     bottom: "layer43-conv"
1547 |     top: "layer43-conv"
1548 |     name: "layer43-scale"
1549 |     type: "Scale"
1550 |     scale_param {
1551 |         bias_term: true
1552 |     }
1553 | }
1554 | layer {
1555 |     bottom: "layer43-conv"
1556 |     top: "layer43-conv"
1557 |     name: "layer43-act"
1558 |     type: "ReLU"
1559 |     relu_param {
1560 |         negative_slope: 0.1
1561 |     }
1562 | }
1563 | layer {
1564 |     bottom: "layer43-conv"
1565 |     top: "layer44-conv"
1566 |     name: "layer44-conv"
1567 |     type: "Convolution"
1568 |     convolution_param {
1569 |         num_output: 256
1570 |         kernel_size: 1
1571 |         pad: 0
1572 |         stride: 1
1573 |         bias_term: false
1574 |     }
1575 | }
1576 | layer {
1577 |     bottom: "layer44-conv"
1578 |     top: "layer44-conv"
1579 |     name: "layer44-bn"
1580 |     type: "BatchNorm"
1581 |     batch_norm_param {
1582 |         use_global_stats: true
1583 |     }
1584 | }
1585 | layer {
1586 |     bottom: "layer44-conv"
1587 |     top: "layer44-conv"
1588 |     name: "layer44-scale"
1589 |     type: "Scale"
1590 |     scale_param {
1591 |         bias_term: true
1592 |     }
1593 | }
1594 | layer {
1595 |     bottom: "layer44-conv"
1596 |     top: "layer44-conv"
1597 |     name: "layer44-act"
1598 |     type: "ReLU"
1599 |     relu_param {
1600 |         negative_slope: 0.1
1601 |     }
1602 | }
1603 | layer {
1604 |     bottom: "layer44-conv"
1605 |     top: "layer45-conv"
1606 |     name: "layer45-conv"
1607 |     type: "Convolution"
1608 |     convolution_param {
1609 |         num_output: 512
1610 |         kernel_size: 3
1611 |         pad: 1
1612 |         stride: 1
1613 |         bias_term: false
1614 |     }
1615 | }
1616 | layer {
1617 |     bottom: "layer45-conv"
1618 |     top: "layer45-conv"
1619 |     name: "layer45-bn"
1620 |     type: "BatchNorm"
1621 |     batch_norm_param {
1622 |         use_global_stats: true
1623 |     }
1624 | }
1625 | layer {
1626 |     bottom: "layer45-conv"
1627 |     top: "layer45-conv"
1628 |     name: "layer45-scale"
1629 |     type: "Scale"
1630 |     scale_param {
1631 |         bias_term: true
1632 |     }
1633 | }
1634 | layer {
1635 |     bottom: "layer45-conv"
1636 |     top: "layer45-conv"
1637 |     name: "layer45-act"
1638 |     type: "ReLU"
1639 |     relu_param {
1640 |         negative_slope: 0.1
1641 |     }
1642 | }
1643 | layer {
1644 |     bottom: "layer45-conv"
1645 |     top: "layer46-conv"
1646 |     name: "layer46-conv"
1647 |     type: "Convolution"
1648 |     convolution_param {
1649 |         num_output: 255
1650 |         kernel_size: 1
1651 |         pad: 0
1652 |         stride: 1
1653 |         bias_term: true
1654 |     }
1655 | }
1656 | layer {
1657 |     bottom: "layer44-conv"
1658 |     top: "layer48-route"
1659 |     name: "layer48-route"
1660 |     type: "Concat"
1661 | }
1662 | layer {
1663 |     bottom: "layer48-route"
1664 |     top: "layer49-conv"
1665 |     name: "layer49-conv"
1666 |     type: "Convolution"
1667 |     convolution_param {
1668 |         num_output: 128
1669 |         kernel_size: 1
1670 |         pad: 0
1671 |         stride: 1
1672 |         bias_term: false
1673 |     }
1674 | }
1675 | layer {
1676 |     bottom: "layer49-conv"
1677 |     top: "layer49-conv"
1678 |     name: "layer49-bn"
1679 |     type: "BatchNorm"
1680 |     batch_norm_param {
1681 |         use_global_stats: true
1682 |     }
1683 | }
1684 | layer {
1685 |     bottom: "layer49-conv"
1686 |     top: "layer49-conv"
1687 |     name: "layer49-scale"
1688 |     type: "Scale"
1689 |     scale_param {
1690 |         bias_term: true
1691 |     }
1692 | }
1693 | layer {
1694 |     bottom: "layer49-conv"
1695 |     top: "layer49-conv"
1696 |     name: "layer49-act"
1697 |     type: "ReLU"
1698 |     relu_param {
1699 |         negative_slope: 0.1
1700 |     }
1701 | }
1702 | layer {
1703 |     bottom: "layer49-conv"
1704 |     top: "layer50-upsample"
1705 |     name: "layer50-upsample"
1706 |     type: "Upsample"
1707 |     upsample_param {
1708 |         scale: 2
1709 |     }
1710 | }
1711 | layer {
1712 |     bottom: "layer50-upsample"
1713 |     bottom: "layer11-conv"
1714 |     top: "layer51-route"
1715 |     name: "layer51-route"
1716 |     type: "Concat"
1717 | }
1718 | layer {
1719 |     bottom: "layer51-route"
1720 |     top: "layer52-conv"
1721 |     name: "layer52-conv"
1722 |     type: "Convolution"
1723 |     convolution_param {
1724 |         num_output: 128
1725 |         kernel_size: 1
1726 |         pad: 0
1727 |         stride: 1
1728 |         bias_term: false
1729 |     }
1730 | }
1731 | layer {
1732 |     bottom: "layer52-conv"
1733 |     top: "layer52-conv"
1734 |     name: "layer52-bn"
1735 |     type: "BatchNorm"
1736 |     batch_norm_param {
1737 |         use_global_stats: true
1738 |     }
1739 | }
1740 | layer {
1741 |     bottom: "layer52-conv"
1742 |     top: "layer52-conv"
1743 |     name: "layer52-scale"
1744 |     type: "Scale"
1745 |     scale_param {
1746 |         bias_term: true
1747 |     }
1748 | }
1749 | layer {
1750 |     bottom: "layer52-conv"
1751 |     top: "layer52-conv"
1752 |     name: "layer52-act"
1753 |     type: "ReLU"
1754 |     relu_param {
1755 |         negative_slope: 0.1
1756 |     }
1757 | }
1758 | layer {
1759 |     bottom: "layer52-conv"
1760 |     top: "layer53-conv"
1761 |     name: "layer53-conv"
1762 |     type: "Convolution"
1763 |     convolution_param {
1764 |         num_output: 256
1765 |         kernel_size: 3
1766 |         pad: 1
1767 |         stride: 1
1768 |         bias_term: false
1769 |     }
1770 | }
1771 | layer {
1772 |     bottom: "layer53-conv"
1773 |     top: "layer53-conv"
1774 |     name: "layer53-bn"
1775 |     type: "BatchNorm"
1776 |     batch_norm_param {
1777 |         use_global_stats: true
1778 |     }
1779 | }
1780 | layer {
1781 |     bottom: "layer53-conv"
1782 |     top: "layer53-conv"
1783 |     name: "layer53-scale"
1784 |     type: "Scale"
1785 |     scale_param {
1786 |         bias_term: true
1787 |     }
1788 | }
1789 | layer {
1790 |     bottom: "layer53-conv"
1791 |     top: "layer53-conv"
1792 |     name: "layer53-act"
1793 |     type: "ReLU"
1794 |     relu_param {
1795 |         negative_slope: 0.1
1796 |     }
1797 | }
1798 | layer {
1799 |     bottom: "layer53-conv"
1800 |     top: "layer54-conv"
1801 |     name: "layer54-conv"
1802 |     type: "Convolution"
1803 |     convolution_param {
1804 |         num_output: 128
1805 |         kernel_size: 1
1806 |         pad: 0
1807 |         stride: 1
1808 |         bias_term: false
1809 |     }
1810 | }
1811 | layer {
1812 |     bottom: "layer54-conv"
1813 |     top: "layer54-conv"
1814 |     name: "layer54-bn"
1815 |     type: "BatchNorm"
1816 |     batch_norm_param {
1817 |         use_global_stats: true
1818 |     }
1819 | }
1820 | layer {
1821 |     bottom: "layer54-conv"
1822 |     top: "layer54-conv"
1823 |     name: "layer54-scale"
1824 |     type: "Scale"
1825 |     scale_param {
1826 |         bias_term: true
1827 |     }
1828 | }
1829 | layer {
1830 |     bottom: "layer54-conv"
1831 |     top: "layer54-conv"
1832 |     name: "layer54-act"
1833 |     type: "ReLU"
1834 |     relu_param {
1835 |         negative_slope: 0.1
1836 |     }
1837 | }
1838 | layer {
1839 |     bottom: "layer54-conv"
1840 |     top: "layer55-conv"
1841 |     name: "layer55-conv"
1842 |     type: "Convolution"
1843 |     convolution_param {
1844 |         num_output: 256
1845 |         kernel_size: 3
1846 |         pad: 1
1847 |         stride: 1
1848 |         bias_term: false
1849 |     }
1850 | }
1851 | layer {
1852 |     bottom: "layer55-conv"
1853 |     top: "layer55-conv"
1854 |     name: "layer55-bn"
1855 |     type: "BatchNorm"
1856 |     batch_norm_param {
1857 |         use_global_stats: true
1858 |     }
1859 | }
1860 | layer {
1861 |     bottom: "layer55-conv"
1862 |     top: "layer55-conv"
1863 |     name: "layer55-scale"
1864 |     type: "Scale"
1865 |     scale_param {
1866 |         bias_term: true
1867 |     }
1868 | }
1869 | layer {
1870 |     bottom: "layer55-conv"
1871 |     top: "layer55-conv"
1872 |     name: "layer55-act"
1873 |     type: "ReLU"
1874 |     relu_param {
1875 |         negative_slope: 0.1
1876 |     }
1877 | }
1878 | layer {
1879 |     bottom: "layer55-conv"
1880 |     top: "layer56-conv"
1881 |     name: "layer56-conv"
1882 |     type: "Convolution"
1883 |     convolution_param {
1884 |         num_output: 128
1885 |         kernel_size: 1
1886 |         pad: 0
1887 |         stride: 1
1888 |         bias_term: false
1889 |     }
1890 | }
1891 | layer {
1892 |     bottom: "layer56-conv"
1893 |     top: "layer56-conv"
1894 |     name: "layer56-bn"
1895 |     type: "BatchNorm"
1896 |     batch_norm_param {
1897 |         use_global_stats: true
1898 |     }
1899 | }
1900 | layer {
1901 |     bottom: "layer56-conv"
1902 |     top: "layer56-conv"
1903 |     name: "layer56-scale"
1904 |     type: "Scale"
1905 |     scale_param {
1906 |         bias_term: true
1907 |     }
1908 | }
1909 | layer {
1910 |     bottom: "layer56-conv"
1911 |     top: "layer56-conv"
1912 |     name: "layer56-act"
1913 |     type: "ReLU"
1914 |     relu_param {
1915 |         negative_slope: 0.1
1916 |     }
1917 | }
1918 | layer {
1919 |     bottom: "layer56-conv"
1920 |     top: "layer57-conv"
1921 |     name: "layer57-conv"
1922 |     type: "Convolution"
1923 |     convolution_param {
1924 |         num_output: 256
1925 |         kernel_size: 3
1926 |         pad: 1
1927 |         stride: 1
1928 |         bias_term: false
1929 |     }
1930 | }
1931 | layer {
1932 |     bottom: "layer57-conv"
1933 |     top: "layer57-conv"
1934 |     name: "layer57-bn"
1935 |     type: "BatchNorm"
1936 |     batch_norm_param {
1937 |         use_global_stats: true
1938 |     }
1939 | }
1940 | layer {
1941 |     bottom: "layer57-conv"
1942 |     top: "layer57-conv"
1943 |     name: "layer57-scale"
1944 |     type: "Scale"
1945 |     scale_param {
1946 |         bias_term: true
1947 |     }
1948 | }
1949 | layer {
1950 |     bottom: "layer57-conv"
1951 |     top: "layer57-conv"
1952 |     name: "layer57-act"
1953 |     type: "ReLU"
1954 |     relu_param {
1955 |         negative_slope: 0.1
1956 |     }
1957 | }
1958 | layer {
1959 |     bottom: "layer57-conv"
1960 |     top: "layer58-conv"
1961 |     name: "layer58-conv"
1962 |     type: "Convolution"
1963 |     convolution_param {
1964 |         num_output: 255
1965 |         kernel_size: 1
1966 |         pad: 0
1967 |         stride: 1
1968 |         bias_term: true
1969 |     }
1970 | }
1971 | 


--------------------------------------------------------------------------------
/prototxt/mobilenet_v2_yolov3.prototxt:
--------------------------------------------------------------------------------
   1 | name: "Darkent2Caffe"
   2 | input: "data"
   3 | input_dim: 1
   4 | input_dim: 3
   5 | input_dim: 416
   6 | input_dim: 416
   7 | 
   8 | layer {
   9 |     bottom: "data"
  10 |     top: "layer1-conv"
  11 |     name: "layer1-conv"
  12 |     type: "Convolution"
  13 |     convolution_param {
  14 |         num_output: 32
  15 |         kernel_size: 3
  16 |         pad: 1
  17 |         stride: 2
  18 |         bias_term: false
  19 |     }
  20 | }
  21 | layer {
  22 |     bottom: "layer1-conv"
  23 |     top: "layer1-conv"
  24 |     name: "layer1-bn"
  25 |     type: "BatchNorm"
  26 |     batch_norm_param {
  27 |         use_global_stats: true
  28 |     }
  29 | }
  30 | layer {
  31 |     bottom: "layer1-conv"
  32 |     top: "layer1-conv"
  33 |     name: "layer1-scale"
  34 |     type: "Scale"
  35 |     scale_param {
  36 |         bias_term: true
  37 |     }
  38 | }
  39 | layer {
  40 |     bottom: "layer1-conv"
  41 |     top: "layer1-conv"
  42 |     name: "layer1-act"
  43 |     type: "ReLU"
  44 |     relu_param {
  45 |         negative_slope: 0.1
  46 |     }
  47 | }
  48 | layer {
  49 |     bottom: "layer1-conv"
  50 |     top: "layer2-conv"
  51 |     name: "layer2-conv"
  52 |     type: "Convolution"
  53 |     convolution_param {
  54 |         num_output: 32
  55 |         kernel_size: 1
  56 |         pad: 0
  57 |         stride: 1
  58 |         bias_term: false
  59 |     }
  60 | }
  61 | layer {
  62 |     bottom: "layer2-conv"
  63 |     top: "layer2-conv"
  64 |     name: "layer2-bn"
  65 |     type: "BatchNorm"
  66 |     batch_norm_param {
  67 |         use_global_stats: true
  68 |     }
  69 | }
  70 | layer {
  71 |     bottom: "layer2-conv"
  72 |     top: "layer2-conv"
  73 |     name: "layer2-scale"
  74 |     type: "Scale"
  75 |     scale_param {
  76 |         bias_term: true
  77 |     }
  78 | }
  79 | layer {
  80 |     bottom: "layer2-conv"
  81 |     top: "layer2-conv"
  82 |     name: "layer2-act"
  83 |     type: "ReLU"
  84 |     relu_param {
  85 |         negative_slope: 0.1
  86 |     }
  87 | }
  88 | layer {
  89 |     bottom: "layer2-conv"
  90 |     top: "layer3-dwconv"
  91 |     name: "layer3-dwconv"
  92 |     type: "ConvolutionDepthwise"
  93 |     convolution_param {
  94 |         num_output: 32
  95 |         kernel_size: 3
  96 |         pad: 1
  97 |         stride: 1
  98 |         bias_term: false
  99 |     }
 100 | }
 101 | layer {
 102 |     bottom: "layer3-dwconv"
 103 |     top: "layer3-dwconv"
 104 |     name: "layer3-bn"
 105 |     type: "BatchNorm"
 106 |     batch_norm_param {
 107 |         use_global_stats: true
 108 |     }
 109 | }
 110 | layer {
 111 |     bottom: "layer3-dwconv"
 112 |     top: "layer3-dwconv"
 113 |     name: "layer3-scale"
 114 |     type: "Scale"
 115 |     scale_param {
 116 |         bias_term: true
 117 |     }
 118 | }
 119 | layer {
 120 |     bottom: "layer3-dwconv"
 121 |     top: "layer3-dwconv"
 122 |     name: "layer3-act"
 123 |     type: "ReLU"
 124 |     relu_param {
 125 |         negative_slope: 0.1
 126 |     }
 127 | }
 128 | layer {
 129 |     bottom: "layer3-dwconv"
 130 |     top: "layer4-conv"
 131 |     name: "layer4-conv"
 132 |     type: "Convolution"
 133 |     convolution_param {
 134 |         num_output: 16
 135 |         kernel_size: 1
 136 |         pad: 0
 137 |         stride: 1
 138 |         bias_term: false
 139 |     }
 140 | }
 141 | layer {
 142 |     bottom: "layer4-conv"
 143 |     top: "layer4-conv"
 144 |     name: "layer4-bn"
 145 |     type: "BatchNorm"
 146 |     batch_norm_param {
 147 |         use_global_stats: true
 148 |     }
 149 | }
 150 | layer {
 151 |     bottom: "layer4-conv"
 152 |     top: "layer4-conv"
 153 |     name: "layer4-scale"
 154 |     type: "Scale"
 155 |     scale_param {
 156 |         bias_term: true
 157 |     }
 158 | }
 159 | layer {
 160 |     bottom: "layer4-conv"
 161 |     top: "layer5-conv"
 162 |     name: "layer5-conv"
 163 |     type: "Convolution"
 164 |     convolution_param {
 165 |         num_output: 96
 166 |         kernel_size: 1
 167 |         pad: 0
 168 |         stride: 1
 169 |         bias_term: false
 170 |     }
 171 | }
 172 | layer {
 173 |     bottom: "layer5-conv"
 174 |     top: "layer5-conv"
 175 |     name: "layer5-bn"
 176 |     type: "BatchNorm"
 177 |     batch_norm_param {
 178 |         use_global_stats: true
 179 |     }
 180 | }
 181 | layer {
 182 |     bottom: "layer5-conv"
 183 |     top: "layer5-conv"
 184 |     name: "layer5-scale"
 185 |     type: "Scale"
 186 |     scale_param {
 187 |         bias_term: true
 188 |     }
 189 | }
 190 | layer {
 191 |     bottom: "layer5-conv"
 192 |     top: "layer5-conv"
 193 |     name: "layer5-act"
 194 |     type: "ReLU"
 195 |     relu_param {
 196 |         negative_slope: 0.1
 197 |     }
 198 | }
 199 | layer {
 200 |     bottom: "layer5-conv"
 201 |     top: "layer6-dwconv"
 202 |     name: "layer6-dwconv"
 203 |     type: "ConvolutionDepthwise"
 204 |     convolution_param {
 205 |         num_output: 96
 206 |         kernel_size: 3
 207 |         pad: 1
 208 |         stride: 2
 209 |         bias_term: false
 210 |     }
 211 | }
 212 | layer {
 213 |     bottom: "layer6-dwconv"
 214 |     top: "layer6-dwconv"
 215 |     name: "layer6-bn"
 216 |     type: "BatchNorm"
 217 |     batch_norm_param {
 218 |         use_global_stats: true
 219 |     }
 220 | }
 221 | layer {
 222 |     bottom: "layer6-dwconv"
 223 |     top: "layer6-dwconv"
 224 |     name: "layer6-scale"
 225 |     type: "Scale"
 226 |     scale_param {
 227 |         bias_term: true
 228 |     }
 229 | }
 230 | layer {
 231 |     bottom: "layer6-dwconv"
 232 |     top: "layer6-dwconv"
 233 |     name: "layer6-act"
 234 |     type: "ReLU"
 235 |     relu_param {
 236 |         negative_slope: 0.1
 237 |     }
 238 | }
 239 | layer {
 240 |     bottom: "layer6-dwconv"
 241 |     top: "layer7-conv"
 242 |     name: "layer7-conv"
 243 |     type: "Convolution"
 244 |     convolution_param {
 245 |         num_output: 24
 246 |         kernel_size: 1
 247 |         pad: 0
 248 |         stride: 1
 249 |         bias_term: false
 250 |     }
 251 | }
 252 | layer {
 253 |     bottom: "layer7-conv"
 254 |     top: "layer7-conv"
 255 |     name: "layer7-bn"
 256 |     type: "BatchNorm"
 257 |     batch_norm_param {
 258 |         use_global_stats: true
 259 |     }
 260 | }
 261 | layer {
 262 |     bottom: "layer7-conv"
 263 |     top: "layer7-conv"
 264 |     name: "layer7-scale"
 265 |     type: "Scale"
 266 |     scale_param {
 267 |         bias_term: true
 268 |     }
 269 | }
 270 | layer {
 271 |     bottom: "layer7-conv"
 272 |     top: "layer8-conv"
 273 |     name: "layer8-conv"
 274 |     type: "Convolution"
 275 |     convolution_param {
 276 |         num_output: 144
 277 |         kernel_size: 1
 278 |         pad: 0
 279 |         stride: 1
 280 |         bias_term: false
 281 |     }
 282 | }
 283 | layer {
 284 |     bottom: "layer8-conv"
 285 |     top: "layer8-conv"
 286 |     name: "layer8-bn"
 287 |     type: "BatchNorm"
 288 |     batch_norm_param {
 289 |         use_global_stats: true
 290 |     }
 291 | }
 292 | layer {
 293 |     bottom: "layer8-conv"
 294 |     top: "layer8-conv"
 295 |     name: "layer8-scale"
 296 |     type: "Scale"
 297 |     scale_param {
 298 |         bias_term: true
 299 |     }
 300 | }
 301 | layer {
 302 |     bottom: "layer8-conv"
 303 |     top: "layer8-conv"
 304 |     name: "layer8-act"
 305 |     type: "ReLU"
 306 |     relu_param {
 307 |         negative_slope: 0.1
 308 |     }
 309 | }
 310 | layer {
 311 |     bottom: "layer8-conv"
 312 |     top: "layer9-dwconv"
 313 |     name: "layer9-dwconv"
 314 |     type: "ConvolutionDepthwise"
 315 |     convolution_param {
 316 |         num_output: 144
 317 |         kernel_size: 3
 318 |         pad: 1
 319 |         stride: 1
 320 |         bias_term: false
 321 |     }
 322 | }
 323 | layer {
 324 |     bottom: "layer9-dwconv"
 325 |     top: "layer9-dwconv"
 326 |     name: "layer9-bn"
 327 |     type: "BatchNorm"
 328 |     batch_norm_param {
 329 |         use_global_stats: true
 330 |     }
 331 | }
 332 | layer {
 333 |     bottom: "layer9-dwconv"
 334 |     top: "layer9-dwconv"
 335 |     name: "layer9-scale"
 336 |     type: "Scale"
 337 |     scale_param {
 338 |         bias_term: true
 339 |     }
 340 | }
 341 | layer {
 342 |     bottom: "layer9-dwconv"
 343 |     top: "layer9-dwconv"
 344 |     name: "layer9-act"
 345 |     type: "ReLU"
 346 |     relu_param {
 347 |         negative_slope: 0.1
 348 |     }
 349 | }
 350 | layer {
 351 |     bottom: "layer9-dwconv"
 352 |     top: "layer10-conv"
 353 |     name: "layer10-conv"
 354 |     type: "Convolution"
 355 |     convolution_param {
 356 |         num_output: 24
 357 |         kernel_size: 1
 358 |         pad: 0
 359 |         stride: 1
 360 |         bias_term: false
 361 |     }
 362 | }
 363 | layer {
 364 |     bottom: "layer10-conv"
 365 |     top: "layer10-conv"
 366 |     name: "layer10-bn"
 367 |     type: "BatchNorm"
 368 |     batch_norm_param {
 369 |         use_global_stats: true
 370 |     }
 371 | }
 372 | layer {
 373 |     bottom: "layer10-conv"
 374 |     top: "layer10-conv"
 375 |     name: "layer10-scale"
 376 |     type: "Scale"
 377 |     scale_param {
 378 |         bias_term: true
 379 |     }
 380 | }
 381 | layer {
 382 |     bottom: "layer7-conv"
 383 |     bottom: "layer10-conv"
 384 |     top: "layer11-shortcut"
 385 |     name: "layer11-shortcut"
 386 |     type: "Eltwise"
 387 |     eltwise_param {
 388 |         operation: SUM
 389 |     }
 390 | }
 391 | layer {
 392 |     bottom: "layer11-shortcut"
 393 |     top: "layer12-conv"
 394 |     name: "layer12-conv"
 395 |     type: "Convolution"
 396 |     convolution_param {
 397 |         num_output: 144
 398 |         kernel_size: 1
 399 |         pad: 0
 400 |         stride: 1
 401 |         bias_term: false
 402 |     }
 403 | }
 404 | layer {
 405 |     bottom: "layer12-conv"
 406 |     top: "layer12-conv"
 407 |     name: "layer12-bn"
 408 |     type: "BatchNorm"
 409 |     batch_norm_param {
 410 |         use_global_stats: true
 411 |     }
 412 | }
 413 | layer {
 414 |     bottom: "layer12-conv"
 415 |     top: "layer12-conv"
 416 |     name: "layer12-scale"
 417 |     type: "Scale"
 418 |     scale_param {
 419 |         bias_term: true
 420 |     }
 421 | }
 422 | layer {
 423 |     bottom: "layer12-conv"
 424 |     top: "layer12-conv"
 425 |     name: "layer12-act"
 426 |     type: "ReLU"
 427 |     relu_param {
 428 |         negative_slope: 0.1
 429 |     }
 430 | }
 431 | layer {
 432 |     bottom: "layer12-conv"
 433 |     top: "layer13-dwconv"
 434 |     name: "layer13-dwconv"
 435 |     type: "ConvolutionDepthwise"
 436 |     convolution_param {
 437 |         num_output: 144
 438 |         kernel_size: 3
 439 |         pad: 1
 440 |         stride: 2
 441 |         bias_term: false
 442 |     }
 443 | }
 444 | layer {
 445 |     bottom: "layer13-dwconv"
 446 |     top: "layer13-dwconv"
 447 |     name: "layer13-bn"
 448 |     type: "BatchNorm"
 449 |     batch_norm_param {
 450 |         use_global_stats: true
 451 |     }
 452 | }
 453 | layer {
 454 |     bottom: "layer13-dwconv"
 455 |     top: "layer13-dwconv"
 456 |     name: "layer13-scale"
 457 |     type: "Scale"
 458 |     scale_param {
 459 |         bias_term: true
 460 |     }
 461 | }
 462 | layer {
 463 |     bottom: "layer13-dwconv"
 464 |     top: "layer13-dwconv"
 465 |     name: "layer13-act"
 466 |     type: "ReLU"
 467 |     relu_param {
 468 |         negative_slope: 0.1
 469 |     }
 470 | }
 471 | layer {
 472 |     bottom: "layer13-dwconv"
 473 |     top: "layer14-conv"
 474 |     name: "layer14-conv"
 475 |     type: "Convolution"
 476 |     convolution_param {
 477 |         num_output: 32
 478 |         kernel_size: 1
 479 |         pad: 0
 480 |         stride: 1
 481 |         bias_term: false
 482 |     }
 483 | }
 484 | layer {
 485 |     bottom: "layer14-conv"
 486 |     top: "layer14-conv"
 487 |     name: "layer14-bn"
 488 |     type: "BatchNorm"
 489 |     batch_norm_param {
 490 |         use_global_stats: true
 491 |     }
 492 | }
 493 | layer {
 494 |     bottom: "layer14-conv"
 495 |     top: "layer14-conv"
 496 |     name: "layer14-scale"
 497 |     type: "Scale"
 498 |     scale_param {
 499 |         bias_term: true
 500 |     }
 501 | }
 502 | layer {
 503 |     bottom: "layer14-conv"
 504 |     top: "layer15-conv"
 505 |     name: "layer15-conv"
 506 |     type: "Convolution"
 507 |     convolution_param {
 508 |         num_output: 192
 509 |         kernel_size: 1
 510 |         pad: 0
 511 |         stride: 1
 512 |         bias_term: false
 513 |     }
 514 | }
 515 | layer {
 516 |     bottom: "layer15-conv"
 517 |     top: "layer15-conv"
 518 |     name: "layer15-bn"
 519 |     type: "BatchNorm"
 520 |     batch_norm_param {
 521 |         use_global_stats: true
 522 |     }
 523 | }
 524 | layer {
 525 |     bottom: "layer15-conv"
 526 |     top: "layer15-conv"
 527 |     name: "layer15-scale"
 528 |     type: "Scale"
 529 |     scale_param {
 530 |         bias_term: true
 531 |     }
 532 | }
 533 | layer {
 534 |     bottom: "layer15-conv"
 535 |     top: "layer15-conv"
 536 |     name: "layer15-act"
 537 |     type: "ReLU"
 538 |     relu_param {
 539 |         negative_slope: 0.1
 540 |     }
 541 | }
 542 | layer {
 543 |     bottom: "layer15-conv"
 544 |     top: "layer16-dwconv"
 545 |     name: "layer16-dwconv"
 546 |     type: "ConvolutionDepthwise"
 547 |     convolution_param {
 548 |         num_output: 192
 549 |         kernel_size: 3
 550 |         pad: 1
 551 |         stride: 1
 552 |         bias_term: false
 553 |     }
 554 | }
 555 | layer {
 556 |     bottom: "layer16-dwconv"
 557 |     top: "layer16-dwconv"
 558 |     name: "layer16-bn"
 559 |     type: "BatchNorm"
 560 |     batch_norm_param {
 561 |         use_global_stats: true
 562 |     }
 563 | }
 564 | layer {
 565 |     bottom: "layer16-dwconv"
 566 |     top: "layer16-dwconv"
 567 |     name: "layer16-scale"
 568 |     type: "Scale"
 569 |     scale_param {
 570 |         bias_term: true
 571 |     }
 572 | }
 573 | layer {
 574 |     bottom: "layer16-dwconv"
 575 |     top: "layer16-dwconv"
 576 |     name: "layer16-act"
 577 |     type: "ReLU"
 578 |     relu_param {
 579 |         negative_slope: 0.1
 580 |     }
 581 | }
 582 | layer {
 583 |     bottom: "layer16-dwconv"
 584 |     top: "layer17-conv"
 585 |     name: "layer17-conv"
 586 |     type: "Convolution"
 587 |     convolution_param {
 588 |         num_output: 32
 589 |         kernel_size: 1
 590 |         pad: 0
 591 |         stride: 1
 592 |         bias_term: false
 593 |     }
 594 | }
 595 | layer {
 596 |     bottom: "layer17-conv"
 597 |     top: "layer17-conv"
 598 |     name: "layer17-bn"
 599 |     type: "BatchNorm"
 600 |     batch_norm_param {
 601 |         use_global_stats: true
 602 |     }
 603 | }
 604 | layer {
 605 |     bottom: "layer17-conv"
 606 |     top: "layer17-conv"
 607 |     name: "layer17-scale"
 608 |     type: "Scale"
 609 |     scale_param {
 610 |         bias_term: true
 611 |     }
 612 | }
 613 | layer {
 614 |     bottom: "layer14-conv"
 615 |     bottom: "layer17-conv"
 616 |     top: "layer18-shortcut"
 617 |     name: "layer18-shortcut"
 618 |     type: "Eltwise"
 619 |     eltwise_param {
 620 |         operation: SUM
 621 |     }
 622 | }
 623 | layer {
 624 |     bottom: "layer18-shortcut"
 625 |     top: "layer19-conv"
 626 |     name: "layer19-conv"
 627 |     type: "Convolution"
 628 |     convolution_param {
 629 |         num_output: 192
 630 |         kernel_size: 1
 631 |         pad: 0
 632 |         stride: 1
 633 |         bias_term: false
 634 |     }
 635 | }
 636 | layer {
 637 |     bottom: "layer19-conv"
 638 |     top: "layer19-conv"
 639 |     name: "layer19-bn"
 640 |     type: "BatchNorm"
 641 |     batch_norm_param {
 642 |         use_global_stats: true
 643 |     }
 644 | }
 645 | layer {
 646 |     bottom: "layer19-conv"
 647 |     top: "layer19-conv"
 648 |     name: "layer19-scale"
 649 |     type: "Scale"
 650 |     scale_param {
 651 |         bias_term: true
 652 |     }
 653 | }
 654 | layer {
 655 |     bottom: "layer19-conv"
 656 |     top: "layer19-conv"
 657 |     name: "layer19-act"
 658 |     type: "ReLU"
 659 |     relu_param {
 660 |         negative_slope: 0.1
 661 |     }
 662 | }
 663 | layer {
 664 |     bottom: "layer19-conv"
 665 |     top: "layer20-dwconv"
 666 |     name: "layer20-dwconv"
 667 |     type: "ConvolutionDepthwise"
 668 |     convolution_param {
 669 |         num_output: 192
 670 |         kernel_size: 3
 671 |         pad: 1
 672 |         stride: 1
 673 |         bias_term: false
 674 |     }
 675 | }
 676 | layer {
 677 |     bottom: "layer20-dwconv"
 678 |     top: "layer20-dwconv"
 679 |     name: "layer20-bn"
 680 |     type: "BatchNorm"
 681 |     batch_norm_param {
 682 |         use_global_stats: true
 683 |     }
 684 | }
 685 | layer {
 686 |     bottom: "layer20-dwconv"
 687 |     top: "layer20-dwconv"
 688 |     name: "layer20-scale"
 689 |     type: "Scale"
 690 |     scale_param {
 691 |         bias_term: true
 692 |     }
 693 | }
 694 | layer {
 695 |     bottom: "layer20-dwconv"
 696 |     top: "layer20-dwconv"
 697 |     name: "layer20-act"
 698 |     type: "ReLU"
 699 |     relu_param {
 700 |         negative_slope: 0.1
 701 |     }
 702 | }
 703 | layer {
 704 |     bottom: "layer20-dwconv"
 705 |     top: "layer21-conv"
 706 |     name: "layer21-conv"
 707 |     type: "Convolution"
 708 |     convolution_param {
 709 |         num_output: 32
 710 |         kernel_size: 1
 711 |         pad: 0
 712 |         stride: 1
 713 |         bias_term: false
 714 |     }
 715 | }
 716 | layer {
 717 |     bottom: "layer21-conv"
 718 |     top: "layer21-conv"
 719 |     name: "layer21-bn"
 720 |     type: "BatchNorm"
 721 |     batch_norm_param {
 722 |         use_global_stats: true
 723 |     }
 724 | }
 725 | layer {
 726 |     bottom: "layer21-conv"
 727 |     top: "layer21-conv"
 728 |     name: "layer21-scale"
 729 |     type: "Scale"
 730 |     scale_param {
 731 |         bias_term: true
 732 |     }
 733 | }
 734 | layer {
 735 |     bottom: "layer18-shortcut"
 736 |     bottom: "layer21-conv"
 737 |     top: "layer22-shortcut"
 738 |     name: "layer22-shortcut"
 739 |     type: "Eltwise"
 740 |     eltwise_param {
 741 |         operation: SUM
 742 |     }
 743 | }
 744 | layer {
 745 |     bottom: "layer22-shortcut"
 746 |     top: "layer23-conv"
 747 |     name: "layer23-conv"
 748 |     type: "Convolution"
 749 |     convolution_param {
 750 |         num_output: 192
 751 |         kernel_size: 1
 752 |         pad: 0
 753 |         stride: 1
 754 |         bias_term: false
 755 |     }
 756 | }
 757 | layer {
 758 |     bottom: "layer23-conv"
 759 |     top: "layer23-conv"
 760 |     name: "layer23-bn"
 761 |     type: "BatchNorm"
 762 |     batch_norm_param {
 763 |         use_global_stats: true
 764 |     }
 765 | }
 766 | layer {
 767 |     bottom: "layer23-conv"
 768 |     top: "layer23-conv"
 769 |     name: "layer23-scale"
 770 |     type: "Scale"
 771 |     scale_param {
 772 |         bias_term: true
 773 |     }
 774 | }
 775 | layer {
 776 |     bottom: "layer23-conv"
 777 |     top: "layer23-conv"
 778 |     name: "layer23-act"
 779 |     type: "ReLU"
 780 |     relu_param {
 781 |         negative_slope: 0.1
 782 |     }
 783 | }
 784 | layer {
 785 |     bottom: "layer23-conv"
 786 |     top: "layer24-dwconv"
 787 |     name: "layer24-dwconv"
 788 |     type: "ConvolutionDepthwise"
 789 |     convolution_param {
 790 |         num_output: 192
 791 |         kernel_size: 3
 792 |         pad: 1
 793 |         stride: 1
 794 |         bias_term: false
 795 |     }
 796 | }
 797 | layer {
 798 |     bottom: "layer24-dwconv"
 799 |     top: "layer24-dwconv"
 800 |     name: "layer24-bn"
 801 |     type: "BatchNorm"
 802 |     batch_norm_param {
 803 |         use_global_stats: true
 804 |     }
 805 | }
 806 | layer {
 807 |     bottom: "layer24-dwconv"
 808 |     top: "layer24-dwconv"
 809 |     name: "layer24-scale"
 810 |     type: "Scale"
 811 |     scale_param {
 812 |         bias_term: true
 813 |     }
 814 | }
 815 | layer {
 816 |     bottom: "layer24-dwconv"
 817 |     top: "layer24-dwconv"
 818 |     name: "layer24-act"
 819 |     type: "ReLU"
 820 |     relu_param {
 821 |         negative_slope: 0.1
 822 |     }
 823 | }
 824 | layer {
 825 |     bottom: "layer24-dwconv"
 826 |     top: "layer25-conv"
 827 |     name: "layer25-conv"
 828 |     type: "Convolution"
 829 |     convolution_param {
 830 |         num_output: 64
 831 |         kernel_size: 1
 832 |         pad: 0
 833 |         stride: 1
 834 |         bias_term: false
 835 |     }
 836 | }
 837 | layer {
 838 |     bottom: "layer25-conv"
 839 |     top: "layer25-conv"
 840 |     name: "layer25-bn"
 841 |     type: "BatchNorm"
 842 |     batch_norm_param {
 843 |         use_global_stats: true
 844 |     }
 845 | }
 846 | layer {
 847 |     bottom: "layer25-conv"
 848 |     top: "layer25-conv"
 849 |     name: "layer25-scale"
 850 |     type: "Scale"
 851 |     scale_param {
 852 |         bias_term: true
 853 |     }
 854 | }
 855 | layer {
 856 |     bottom: "layer25-conv"
 857 |     top: "layer26-conv"
 858 |     name: "layer26-conv"
 859 |     type: "Convolution"
 860 |     convolution_param {
 861 |         num_output: 384
 862 |         kernel_size: 1
 863 |         pad: 0
 864 |         stride: 1
 865 |         bias_term: false
 866 |     }
 867 | }
 868 | layer {
 869 |     bottom: "layer26-conv"
 870 |     top: "layer26-conv"
 871 |     name: "layer26-bn"
 872 |     type: "BatchNorm"
 873 |     batch_norm_param {
 874 |         use_global_stats: true
 875 |     }
 876 | }
 877 | layer {
 878 |     bottom: "layer26-conv"
 879 |     top: "layer26-conv"
 880 |     name: "layer26-scale"
 881 |     type: "Scale"
 882 |     scale_param {
 883 |         bias_term: true
 884 |     }
 885 | }
 886 | layer {
 887 |     bottom: "layer26-conv"
 888 |     top: "layer26-conv"
 889 |     name: "layer26-act"
 890 |     type: "ReLU"
 891 |     relu_param {
 892 |         negative_slope: 0.1
 893 |     }
 894 | }
 895 | layer {
 896 |     bottom: "layer26-conv"
 897 |     top: "layer27-dwconv"
 898 |     name: "layer27-dwconv"
 899 |     type: "ConvolutionDepthwise"
 900 |     convolution_param {
 901 |         num_output: 384
 902 |         kernel_size: 3
 903 |         pad: 1
 904 |         stride: 1
 905 |         bias_term: false
 906 |     }
 907 | }
 908 | layer {
 909 |     bottom: "layer27-dwconv"
 910 |     top: "layer27-dwconv"
 911 |     name: "layer27-bn"
 912 |     type: "BatchNorm"
 913 |     batch_norm_param {
 914 |         use_global_stats: true
 915 |     }
 916 | }
 917 | layer {
 918 |     bottom: "layer27-dwconv"
 919 |     top: "layer27-dwconv"
 920 |     name: "layer27-scale"
 921 |     type: "Scale"
 922 |     scale_param {
 923 |         bias_term: true
 924 |     }
 925 | }
 926 | layer {
 927 |     bottom: "layer27-dwconv"
 928 |     top: "layer27-dwconv"
 929 |     name: "layer27-act"
 930 |     type: "ReLU"
 931 |     relu_param {
 932 |         negative_slope: 0.1
 933 |     }
 934 | }
 935 | layer {
 936 |     bottom: "layer27-dwconv"
 937 |     top: "layer28-conv"
 938 |     name: "layer28-conv"
 939 |     type: "Convolution"
 940 |     convolution_param {
 941 |         num_output: 64
 942 |         kernel_size: 1
 943 |         pad: 0
 944 |         stride: 1
 945 |         bias_term: false
 946 |     }
 947 | }
 948 | layer {
 949 |     bottom: "layer28-conv"
 950 |     top: "layer28-conv"
 951 |     name: "layer28-bn"
 952 |     type: "BatchNorm"
 953 |     batch_norm_param {
 954 |         use_global_stats: true
 955 |     }
 956 | }
 957 | layer {
 958 |     bottom: "layer28-conv"
 959 |     top: "layer28-conv"
 960 |     name: "layer28-scale"
 961 |     type: "Scale"
 962 |     scale_param {
 963 |         bias_term: true
 964 |     }
 965 | }
 966 | layer {
 967 |     bottom: "layer25-conv"
 968 |     bottom: "layer28-conv"
 969 |     top: "layer29-shortcut"
 970 |     name: "layer29-shortcut"
 971 |     type: "Eltwise"
 972 |     eltwise_param {
 973 |         operation: SUM
 974 |     }
 975 | }
 976 | layer {
 977 |     bottom: "layer29-shortcut"
 978 |     top: "layer30-conv"
 979 |     name: "layer30-conv"
 980 |     type: "Convolution"
 981 |     convolution_param {
 982 |         num_output: 384
 983 |         kernel_size: 1
 984 |         pad: 0
 985 |         stride: 1
 986 |         bias_term: false
 987 |     }
 988 | }
 989 | layer {
 990 |     bottom: "layer30-conv"
 991 |     top: "layer30-conv"
 992 |     name: "layer30-bn"
 993 |     type: "BatchNorm"
 994 |     batch_norm_param {
 995 |         use_global_stats: true
 996 |     }
 997 | }
 998 | layer {
 999 |     bottom: "layer30-conv"
1000 |     top: "layer30-conv"
1001 |     name: "layer30-scale"
1002 |     type: "Scale"
1003 |     scale_param {
1004 |         bias_term: true
1005 |     }
1006 | }
1007 | layer {
1008 |     bottom: "layer30-conv"
1009 |     top: "layer30-conv"
1010 |     name: "layer30-act"
1011 |     type: "ReLU"
1012 |     relu_param {
1013 |         negative_slope: 0.1
1014 |     }
1015 | }
1016 | layer {
1017 |     bottom: "layer30-conv"
1018 |     top: "layer31-dwconv"
1019 |     name: "layer31-dwconv"
1020 |     type: "ConvolutionDepthwise"
1021 |     convolution_param {
1022 |         num_output: 384
1023 |         kernel_size: 3
1024 |         pad: 1
1025 |         stride: 1
1026 |         bias_term: false
1027 |     }
1028 | }
1029 | layer {
1030 |     bottom: "layer31-dwconv"
1031 |     top: "layer31-dwconv"
1032 |     name: "layer31-bn"
1033 |     type: "BatchNorm"
1034 |     batch_norm_param {
1035 |         use_global_stats: true
1036 |     }
1037 | }
1038 | layer {
1039 |     bottom: "layer31-dwconv"
1040 |     top: "layer31-dwconv"
1041 |     name: "layer31-scale"
1042 |     type: "Scale"
1043 |     scale_param {
1044 |         bias_term: true
1045 |     }
1046 | }
1047 | layer {
1048 |     bottom: "layer31-dwconv"
1049 |     top: "layer31-dwconv"
1050 |     name: "layer31-act"
1051 |     type: "ReLU"
1052 |     relu_param {
1053 |         negative_slope: 0.1
1054 |     }
1055 | }
1056 | layer {
1057 |     bottom: "layer31-dwconv"
1058 |     top: "layer32-conv"
1059 |     name: "layer32-conv"
1060 |     type: "Convolution"
1061 |     convolution_param {
1062 |         num_output: 64
1063 |         kernel_size: 1
1064 |         pad: 0
1065 |         stride: 1
1066 |         bias_term: false
1067 |     }
1068 | }
1069 | layer {
1070 |     bottom: "layer32-conv"
1071 |     top: "layer32-conv"
1072 |     name: "layer32-bn"
1073 |     type: "BatchNorm"
1074 |     batch_norm_param {
1075 |         use_global_stats: true
1076 |     }
1077 | }
1078 | layer {
1079 |     bottom: "layer32-conv"
1080 |     top: "layer32-conv"
1081 |     name: "layer32-scale"
1082 |     type: "Scale"
1083 |     scale_param {
1084 |         bias_term: true
1085 |     }
1086 | }
1087 | layer {
1088 |     bottom: "layer29-shortcut"
1089 |     bottom: "layer32-conv"
1090 |     top: "layer33-shortcut"
1091 |     name: "layer33-shortcut"
1092 |     type: "Eltwise"
1093 |     eltwise_param {
1094 |         operation: SUM
1095 |     }
1096 | }
1097 | layer {
1098 |     bottom: "layer33-shortcut"
1099 |     top: "layer34-conv"
1100 |     name: "layer34-conv"
1101 |     type: "Convolution"
1102 |     convolution_param {
1103 |         num_output: 384
1104 |         kernel_size: 1
1105 |         pad: 0
1106 |         stride: 1
1107 |         bias_term: false
1108 |     }
1109 | }
1110 | layer {
1111 |     bottom: "layer34-conv"
1112 |     top: "layer34-conv"
1113 |     name: "layer34-bn"
1114 |     type: "BatchNorm"
1115 |     batch_norm_param {
1116 |         use_global_stats: true
1117 |     }
1118 | }
1119 | layer {
1120 |     bottom: "layer34-conv"
1121 |     top: "layer34-conv"
1122 |     name: "layer34-scale"
1123 |     type: "Scale"
1124 |     scale_param {
1125 |         bias_term: true
1126 |     }
1127 | }
1128 | layer {
1129 |     bottom: "layer34-conv"
1130 |     top: "layer34-conv"
1131 |     name: "layer34-act"
1132 |     type: "ReLU"
1133 |     relu_param {
1134 |         negative_slope: 0.1
1135 |     }
1136 | }
1137 | layer {
1138 |     bottom: "layer34-conv"
1139 |     top: "layer35-dwconv"
1140 |     name: "layer35-dwconv"
1141 |     type: "ConvolutionDepthwise"
1142 |     convolution_param {
1143 |         num_output: 384
1144 |         kernel_size: 3
1145 |         pad: 1
1146 |         stride: 1
1147 |         bias_term: false
1148 |     }
1149 | }
1150 | layer {
1151 |     bottom: "layer35-dwconv"
1152 |     top: "layer35-dwconv"
1153 |     name: "layer35-bn"
1154 |     type: "BatchNorm"
1155 |     batch_norm_param {
1156 |         use_global_stats: true
1157 |     }
1158 | }
1159 | layer {
1160 |     bottom: "layer35-dwconv"
1161 |     top: "layer35-dwconv"
1162 |     name: "layer35-scale"
1163 |     type: "Scale"
1164 |     scale_param {
1165 |         bias_term: true
1166 |     }
1167 | }
1168 | layer {
1169 |     bottom: "layer35-dwconv"
1170 |     top: "layer35-dwconv"
1171 |     name: "layer35-act"
1172 |     type: "ReLU"
1173 |     relu_param {
1174 |         negative_slope: 0.1
1175 |     }
1176 | }
1177 | layer {
1178 |     bottom: "layer35-dwconv"
1179 |     top: "layer36-conv"
1180 |     name: "layer36-conv"
1181 |     type: "Convolution"
1182 |     convolution_param {
1183 |         num_output: 64
1184 |         kernel_size: 1
1185 |         pad: 0
1186 |         stride: 1
1187 |         bias_term: false
1188 |     }
1189 | }
1190 | layer {
1191 |     bottom: "layer36-conv"
1192 |     top: "layer36-conv"
1193 |     name: "layer36-bn"
1194 |     type: "BatchNorm"
1195 |     batch_norm_param {
1196 |         use_global_stats: true
1197 |     }
1198 | }
1199 | layer {
1200 |     bottom: "layer36-conv"
1201 |     top: "layer36-conv"
1202 |     name: "layer36-scale"
1203 |     type: "Scale"
1204 |     scale_param {
1205 |         bias_term: true
1206 |     }
1207 | }
1208 | layer {
1209 |     bottom: "layer33-shortcut"
1210 |     bottom: "layer36-conv"
1211 |     top: "layer37-shortcut"
1212 |     name: "layer37-shortcut"
1213 |     type: "Eltwise"
1214 |     eltwise_param {
1215 |         operation: SUM
1216 |     }
1217 | }
1218 | layer {
1219 |     bottom: "layer37-shortcut"
1220 |     top: "layer38-conv"
1221 |     name: "layer38-conv"
1222 |     type: "Convolution"
1223 |     convolution_param {
1224 |         num_output: 384
1225 |         kernel_size: 1
1226 |         pad: 0
1227 |         stride: 1
1228 |         bias_term: false
1229 |     }
1230 | }
1231 | layer {
1232 |     bottom: "layer38-conv"
1233 |     top: "layer38-conv"
1234 |     name: "layer38-bn"
1235 |     type: "BatchNorm"
1236 |     batch_norm_param {
1237 |         use_global_stats: true
1238 |     }
1239 | }
1240 | layer {
1241 |     bottom: "layer38-conv"
1242 |     top: "layer38-conv"
1243 |     name: "layer38-scale"
1244 |     type: "Scale"
1245 |     scale_param {
1246 |         bias_term: true
1247 |     }
1248 | }
1249 | layer {
1250 |     bottom: "layer38-conv"
1251 |     top: "layer38-conv"
1252 |     name: "layer38-act"
1253 |     type: "ReLU"
1254 |     relu_param {
1255 |         negative_slope: 0.1
1256 |     }
1257 | }
1258 | layer {
1259 |     bottom: "layer38-conv"
1260 |     top: "layer39-dwconv"
1261 |     name: "layer39-dwconv"
1262 |     type: "ConvolutionDepthwise"
1263 |     convolution_param {
1264 |         num_output: 384
1265 |         kernel_size: 3
1266 |         pad: 1
1267 |         stride: 2
1268 |         bias_term: false
1269 |     }
1270 | }
1271 | layer {
1272 |     bottom: "layer39-dwconv"
1273 |     top: "layer39-dwconv"
1274 |     name: "layer39-bn"
1275 |     type: "BatchNorm"
1276 |     batch_norm_param {
1277 |         use_global_stats: true
1278 |     }
1279 | }
1280 | layer {
1281 |     bottom: "layer39-dwconv"
1282 |     top: "layer39-dwconv"
1283 |     name: "layer39-scale"
1284 |     type: "Scale"
1285 |     scale_param {
1286 |         bias_term: true
1287 |     }
1288 | }
1289 | layer {
1290 |     bottom: "layer39-dwconv"
1291 |     top: "layer39-dwconv"
1292 |     name: "layer39-act"
1293 |     type: "ReLU"
1294 |     relu_param {
1295 |         negative_slope: 0.1
1296 |     }
1297 | }
1298 | layer {
1299 |     bottom: "layer39-dwconv"
1300 |     top: "layer40-conv"
1301 |     name: "layer40-conv"
1302 |     type: "Convolution"
1303 |     convolution_param {
1304 |         num_output: 96
1305 |         kernel_size: 1
1306 |         pad: 0
1307 |         stride: 1
1308 |         bias_term: false
1309 |     }
1310 | }
1311 | layer {
1312 |     bottom: "layer40-conv"
1313 |     top: "layer40-conv"
1314 |     name: "layer40-bn"
1315 |     type: "BatchNorm"
1316 |     batch_norm_param {
1317 |         use_global_stats: true
1318 |     }
1319 | }
1320 | layer {
1321 |     bottom: "layer40-conv"
1322 |     top: "layer40-conv"
1323 |     name: "layer40-scale"
1324 |     type: "Scale"
1325 |     scale_param {
1326 |         bias_term: true
1327 |     }
1328 | }
1329 | layer {
1330 |     bottom: "layer40-conv"
1331 |     top: "layer41-conv"
1332 |     name: "layer41-conv"
1333 |     type: "Convolution"
1334 |     convolution_param {
1335 |         num_output: 576
1336 |         kernel_size: 1
1337 |         pad: 0
1338 |         stride: 1
1339 |         bias_term: false
1340 |     }
1341 | }
1342 | layer {
1343 |     bottom: "layer41-conv"
1344 |     top: "layer41-conv"
1345 |     name: "layer41-bn"
1346 |     type: "BatchNorm"
1347 |     batch_norm_param {
1348 |         use_global_stats: true
1349 |     }
1350 | }
1351 | layer {
1352 |     bottom: "layer41-conv"
1353 |     top: "layer41-conv"
1354 |     name: "layer41-scale"
1355 |     type: "Scale"
1356 |     scale_param {
1357 |         bias_term: true
1358 |     }
1359 | }
1360 | layer {
1361 |     bottom: "layer41-conv"
1362 |     top: "layer41-conv"
1363 |     name: "layer41-act"
1364 |     type: "ReLU"
1365 |     relu_param {
1366 |         negative_slope: 0.1
1367 |     }
1368 | }
1369 | layer {
1370 |     bottom: "layer41-conv"
1371 |     top: "layer42-dwconv"
1372 |     name: "layer42-dwconv"
1373 |     type: "ConvolutionDepthwise"
1374 |     convolution_param {
1375 |         num_output: 576
1376 |         kernel_size: 3
1377 |         pad: 1
1378 |         stride: 1
1379 |         bias_term: false
1380 |     }
1381 | }
1382 | layer {
1383 |     bottom: "layer42-dwconv"
1384 |     top: "layer42-dwconv"
1385 |     name: "layer42-bn"
1386 |     type: "BatchNorm"
1387 |     batch_norm_param {
1388 |         use_global_stats: true
1389 |     }
1390 | }
1391 | layer {
1392 |     bottom: "layer42-dwconv"
1393 |     top: "layer42-dwconv"
1394 |     name: "layer42-scale"
1395 |     type: "Scale"
1396 |     scale_param {
1397 |         bias_term: true
1398 |     }
1399 | }
1400 | layer {
1401 |     bottom: "layer42-dwconv"
1402 |     top: "layer42-dwconv"
1403 |     name: "layer42-act"
1404 |     type: "ReLU"
1405 |     relu_param {
1406 |         negative_slope: 0.1
1407 |     }
1408 | }
1409 | layer {
1410 |     bottom: "layer42-dwconv"
1411 |     top: "layer43-conv"
1412 |     name: "layer43-conv"
1413 |     type: "Convolution"
1414 |     convolution_param {
1415 |         num_output: 96
1416 |         kernel_size: 1
1417 |         pad: 0
1418 |         stride: 1
1419 |         bias_term: false
1420 |     }
1421 | }
1422 | layer {
1423 |     bottom: "layer43-conv"
1424 |     top: "layer43-conv"
1425 |     name: "layer43-bn"
1426 |     type: "BatchNorm"
1427 |     batch_norm_param {
1428 |         use_global_stats: true
1429 |     }
1430 | }
1431 | layer {
1432 |     bottom: "layer43-conv"
1433 |     top: "layer43-conv"
1434 |     name: "layer43-scale"
1435 |     type: "Scale"
1436 |     scale_param {
1437 |         bias_term: true
1438 |     }
1439 | }
1440 | layer {
1441 |     bottom: "layer40-conv"
1442 |     bottom: "layer43-conv"
1443 |     top: "layer44-shortcut"
1444 |     name: "layer44-shortcut"
1445 |     type: "Eltwise"
1446 |     eltwise_param {
1447 |         operation: SUM
1448 |     }
1449 | }
1450 | layer {
1451 |     bottom: "layer44-shortcut"
1452 |     top: "layer45-conv"
1453 |     name: "layer45-conv"
1454 |     type: "Convolution"
1455 |     convolution_param {
1456 |         num_output: 576
1457 |         kernel_size: 1
1458 |         pad: 0
1459 |         stride: 1
1460 |         bias_term: false
1461 |     }
1462 | }
1463 | layer {
1464 |     bottom: "layer45-conv"
1465 |     top: "layer45-conv"
1466 |     name: "layer45-bn"
1467 |     type: "BatchNorm"
1468 |     batch_norm_param {
1469 |         use_global_stats: true
1470 |     }
1471 | }
1472 | layer {
1473 |     bottom: "layer45-conv"
1474 |     top: "layer45-conv"
1475 |     name: "layer45-scale"
1476 |     type: "Scale"
1477 |     scale_param {
1478 |         bias_term: true
1479 |     }
1480 | }
1481 | layer {
1482 |     bottom: "layer45-conv"
1483 |     top: "layer45-conv"
1484 |     name: "layer45-act"
1485 |     type: "ReLU"
1486 |     relu_param {
1487 |         negative_slope: 0.1
1488 |     }
1489 | }
1490 | layer {
1491 |     bottom: "layer45-conv"
1492 |     top: "layer46-dwconv"
1493 |     name: "layer46-dwconv"
1494 |     type: "ConvolutionDepthwise"
1495 |     convolution_param {
1496 |         num_output: 576
1497 |         kernel_size: 3
1498 |         pad: 1
1499 |         stride: 1
1500 |         bias_term: false
1501 |     }
1502 | }
1503 | layer {
1504 |     bottom: "layer46-dwconv"
1505 |     top: "layer46-dwconv"
1506 |     name: "layer46-bn"
1507 |     type: "BatchNorm"
1508 |     batch_norm_param {
1509 |         use_global_stats: true
1510 |     }
1511 | }
1512 | layer {
1513 |     bottom: "layer46-dwconv"
1514 |     top: "layer46-dwconv"
1515 |     name: "layer46-scale"
1516 |     type: "Scale"
1517 |     scale_param {
1518 |         bias_term: true
1519 |     }
1520 | }
1521 | layer {
1522 |     bottom: "layer46-dwconv"
1523 |     top: "layer46-dwconv"
1524 |     name: "layer46-act"
1525 |     type: "ReLU"
1526 |     relu_param {
1527 |         negative_slope: 0.1
1528 |     }
1529 | }
1530 | layer {
1531 |     bottom: "layer46-dwconv"
1532 |     top: "layer47-conv"
1533 |     name: "layer47-conv"
1534 |     type: "Convolution"
1535 |     convolution_param {
1536 |         num_output: 96
1537 |         kernel_size: 1
1538 |         pad: 0
1539 |         stride: 1
1540 |         bias_term: false
1541 |     }
1542 | }
1543 | layer {
1544 |     bottom: "layer47-conv"
1545 |     top: "layer47-conv"
1546 |     name: "layer47-bn"
1547 |     type: "BatchNorm"
1548 |     batch_norm_param {
1549 |         use_global_stats: true
1550 |     }
1551 | }
1552 | layer {
1553 |     bottom: "layer47-conv"
1554 |     top: "layer47-conv"
1555 |     name: "layer47-scale"
1556 |     type: "Scale"
1557 |     scale_param {
1558 |         bias_term: true
1559 |     }
1560 | }
1561 | layer {
1562 |     bottom: "layer44-shortcut"
1563 |     bottom: "layer47-conv"
1564 |     top: "layer48-shortcut"
1565 |     name: "layer48-shortcut"
1566 |     type: "Eltwise"
1567 |     eltwise_param {
1568 |         operation: SUM
1569 |     }
1570 | }
1571 | layer {
1572 |     bottom: "layer48-shortcut"
1573 |     top: "layer49-conv"
1574 |     name: "layer49-conv"
1575 |     type: "Convolution"
1576 |     convolution_param {
1577 |         num_output: 576
1578 |         kernel_size: 1
1579 |         pad: 0
1580 |         stride: 1
1581 |         bias_term: false
1582 |     }
1583 | }
1584 | layer {
1585 |     bottom: "layer49-conv"
1586 |     top: "layer49-conv"
1587 |     name: "layer49-bn"
1588 |     type: "BatchNorm"
1589 |     batch_norm_param {
1590 |         use_global_stats: true
1591 |     }
1592 | }
1593 | layer {
1594 |     bottom: "layer49-conv"
1595 |     top: "layer49-conv"
1596 |     name: "layer49-scale"
1597 |     type: "Scale"
1598 |     scale_param {
1599 |         bias_term: true
1600 |     }
1601 | }
1602 | layer {
1603 |     bottom: "layer49-conv"
1604 |     top: "layer49-conv"
1605 |     name: "layer49-act"
1606 |     type: "ReLU"
1607 |     relu_param {
1608 |         negative_slope: 0.1
1609 |     }
1610 | }
1611 | layer {
1612 |     bottom: "layer49-conv"
1613 |     top: "layer50-dwconv"
1614 |     name: "layer50-dwconv"
1615 |     type: "ConvolutionDepthwise"
1616 |     convolution_param {
1617 |         num_output: 576
1618 |         kernel_size: 3
1619 |         pad: 1
1620 |         stride: 2
1621 |         bias_term: false
1622 |     }
1623 | }
1624 | layer {
1625 |     bottom: "layer50-dwconv"
1626 |     top: "layer50-dwconv"
1627 |     name: "layer50-bn"
1628 |     type: "BatchNorm"
1629 |     batch_norm_param {
1630 |         use_global_stats: true
1631 |     }
1632 | }
1633 | layer {
1634 |     bottom: "layer50-dwconv"
1635 |     top: "layer50-dwconv"
1636 |     name: "layer50-scale"
1637 |     type: "Scale"
1638 |     scale_param {
1639 |         bias_term: true
1640 |     }
1641 | }
1642 | layer {
1643 |     bottom: "layer50-dwconv"
1644 |     top: "layer50-dwconv"
1645 |     name: "layer50-act"
1646 |     type: "ReLU"
1647 |     relu_param {
1648 |         negative_slope: 0.1
1649 |     }
1650 | }
1651 | layer {
1652 |     bottom: "layer50-dwconv"
1653 |     top: "layer51-conv"
1654 |     name: "layer51-conv"
1655 |     type: "Convolution"
1656 |     convolution_param {
1657 |         num_output: 160
1658 |         kernel_size: 1
1659 |         pad: 0
1660 |         stride: 1
1661 |         bias_term: false
1662 |     }
1663 | }
1664 | layer {
1665 |     bottom: "layer51-conv"
1666 |     top: "layer51-conv"
1667 |     name: "layer51-bn"
1668 |     type: "BatchNorm"
1669 |     batch_norm_param {
1670 |         use_global_stats: true
1671 |     }
1672 | }
1673 | layer {
1674 |     bottom: "layer51-conv"
1675 |     top: "layer51-conv"
1676 |     name: "layer51-scale"
1677 |     type: "Scale"
1678 |     scale_param {
1679 |         bias_term: true
1680 |     }
1681 | }
1682 | layer {
1683 |     bottom: "layer51-conv"
1684 |     top: "layer52-conv"
1685 |     name: "layer52-conv"
1686 |     type: "Convolution"
1687 |     convolution_param {
1688 |         num_output: 960
1689 |         kernel_size: 1
1690 |         pad: 0
1691 |         stride: 1
1692 |         bias_term: false
1693 |     }
1694 | }
1695 | layer {
1696 |     bottom: "layer52-conv"
1697 |     top: "layer52-conv"
1698 |     name: "layer52-bn"
1699 |     type: "BatchNorm"
1700 |     batch_norm_param {
1701 |         use_global_stats: true
1702 |     }
1703 | }
1704 | layer {
1705 |     bottom: "layer52-conv"
1706 |     top: "layer52-conv"
1707 |     name: "layer52-scale"
1708 |     type: "Scale"
1709 |     scale_param {
1710 |         bias_term: true
1711 |     }
1712 | }
1713 | layer {
1714 |     bottom: "layer52-conv"
1715 |     top: "layer52-conv"
1716 |     name: "layer52-act"
1717 |     type: "ReLU"
1718 |     relu_param {
1719 |         negative_slope: 0.1
1720 |     }
1721 | }
1722 | layer {
1723 |     bottom: "layer52-conv"
1724 |     top: "layer53-dwconv"
1725 |     name: "layer53-dwconv"
1726 |     type: "ConvolutionDepthwise"
1727 |     convolution_param {
1728 |         num_output: 960
1729 |         kernel_size: 3
1730 |         pad: 1
1731 |         stride: 1
1732 |         bias_term: false
1733 |     }
1734 | }
1735 | layer {
1736 |     bottom: "layer53-dwconv"
1737 |     top: "layer53-dwconv"
1738 |     name: "layer53-bn"
1739 |     type: "BatchNorm"
1740 |     batch_norm_param {
1741 |         use_global_stats: true
1742 |     }
1743 | }
1744 | layer {
1745 |     bottom: "layer53-dwconv"
1746 |     top: "layer53-dwconv"
1747 |     name: "layer53-scale"
1748 |     type: "Scale"
1749 |     scale_param {
1750 |         bias_term: true
1751 |     }
1752 | }
1753 | layer {
1754 |     bottom: "layer53-dwconv"
1755 |     top: "layer53-dwconv"
1756 |     name: "layer53-act"
1757 |     type: "ReLU"
1758 |     relu_param {
1759 |         negative_slope: 0.1
1760 |     }
1761 | }
1762 | layer {
1763 |     bottom: "layer53-dwconv"
1764 |     top: "layer54-conv"
1765 |     name: "layer54-conv"
1766 |     type: "Convolution"
1767 |     convolution_param {
1768 |         num_output: 160
1769 |         kernel_size: 1
1770 |         pad: 0
1771 |         stride: 1
1772 |         bias_term: false
1773 |     }
1774 | }
1775 | layer {
1776 |     bottom: "layer54-conv"
1777 |     top: "layer54-conv"
1778 |     name: "layer54-bn"
1779 |     type: "BatchNorm"
1780 |     batch_norm_param {
1781 |         use_global_stats: true
1782 |     }
1783 | }
1784 | layer {
1785 |     bottom: "layer54-conv"
1786 |     top: "layer54-conv"
1787 |     name: "layer54-scale"
1788 |     type: "Scale"
1789 |     scale_param {
1790 |         bias_term: true
1791 |     }
1792 | }
1793 | layer {
1794 |     bottom: "layer51-conv"
1795 |     bottom: "layer54-conv"
1796 |     top: "layer55-shortcut"
1797 |     name: "layer55-shortcut"
1798 |     type: "Eltwise"
1799 |     eltwise_param {
1800 |         operation: SUM
1801 |     }
1802 | }
1803 | layer {
1804 |     bottom: "layer55-shortcut"
1805 |     top: "layer56-conv"
1806 |     name: "layer56-conv"
1807 |     type: "Convolution"
1808 |     convolution_param {
1809 |         num_output: 960
1810 |         kernel_size: 1
1811 |         pad: 0
1812 |         stride: 1
1813 |         bias_term: false
1814 |     }
1815 | }
1816 | layer {
1817 |     bottom: "layer56-conv"
1818 |     top: "layer56-conv"
1819 |     name: "layer56-bn"
1820 |     type: "BatchNorm"
1821 |     batch_norm_param {
1822 |         use_global_stats: true
1823 |     }
1824 | }
1825 | layer {
1826 |     bottom: "layer56-conv"
1827 |     top: "layer56-conv"
1828 |     name: "layer56-scale"
1829 |     type: "Scale"
1830 |     scale_param {
1831 |         bias_term: true
1832 |     }
1833 | }
1834 | layer {
1835 |     bottom: "layer56-conv"
1836 |     top: "layer56-conv"
1837 |     name: "layer56-act"
1838 |     type: "ReLU"
1839 |     relu_param {
1840 |         negative_slope: 0.1
1841 |     }
1842 | }
1843 | layer {
1844 |     bottom: "layer56-conv"
1845 |     top: "layer57-dwconv"
1846 |     name: "layer57-dwconv"
1847 |     type: "ConvolutionDepthwise"
1848 |     convolution_param {
1849 |         num_output: 960
1850 |         kernel_size: 3
1851 |         pad: 1
1852 |         stride: 1
1853 |         bias_term: false
1854 |     }
1855 | }
1856 | layer {
1857 |     bottom: "layer57-dwconv"
1858 |     top: "layer57-dwconv"
1859 |     name: "layer57-bn"
1860 |     type: "BatchNorm"
1861 |     batch_norm_param {
1862 |         use_global_stats: true
1863 |     }
1864 | }
1865 | layer {
1866 |     bottom: "layer57-dwconv"
1867 |     top: "layer57-dwconv"
1868 |     name: "layer57-scale"
1869 |     type: "Scale"
1870 |     scale_param {
1871 |         bias_term: true
1872 |     }
1873 | }
1874 | layer {
1875 |     bottom: "layer57-dwconv"
1876 |     top: "layer57-dwconv"
1877 |     name: "layer57-act"
1878 |     type: "ReLU"
1879 |     relu_param {
1880 |         negative_slope: 0.1
1881 |     }
1882 | }
1883 | layer {
1884 |     bottom: "layer57-dwconv"
1885 |     top: "layer58-conv"
1886 |     name: "layer58-conv"
1887 |     type: "Convolution"
1888 |     convolution_param {
1889 |         num_output: 160
1890 |         kernel_size: 1
1891 |         pad: 0
1892 |         stride: 1
1893 |         bias_term: false
1894 |     }
1895 | }
1896 | layer {
1897 |     bottom: "layer58-conv"
1898 |     top: "layer58-conv"
1899 |     name: "layer58-bn"
1900 |     type: "BatchNorm"
1901 |     batch_norm_param {
1902 |         use_global_stats: true
1903 |     }
1904 | }
1905 | layer {
1906 |     bottom: "layer58-conv"
1907 |     top: "layer58-conv"
1908 |     name: "layer58-scale"
1909 |     type: "Scale"
1910 |     scale_param {
1911 |         bias_term: true
1912 |     }
1913 | }
1914 | layer {
1915 |     bottom: "layer55-shortcut"
1916 |     bottom: "layer58-conv"
1917 |     top: "layer59-shortcut"
1918 |     name: "layer59-shortcut"
1919 |     type: "Eltwise"
1920 |     eltwise_param {
1921 |         operation: SUM
1922 |     }
1923 | }
1924 | layer {
1925 |     bottom: "layer59-shortcut"
1926 |     top: "layer60-conv"
1927 |     name: "layer60-conv"
1928 |     type: "Convolution"
1929 |     convolution_param {
1930 |         num_output: 960
1931 |         kernel_size: 1
1932 |         pad: 0
1933 |         stride: 1
1934 |         bias_term: false
1935 |     }
1936 | }
1937 | layer {
1938 |     bottom: "layer60-conv"
1939 |     top: "layer60-conv"
1940 |     name: "layer60-bn"
1941 |     type: "BatchNorm"
1942 |     batch_norm_param {
1943 |         use_global_stats: true
1944 |     }
1945 | }
1946 | layer {
1947 |     bottom: "layer60-conv"
1948 |     top: "layer60-conv"
1949 |     name: "layer60-scale"
1950 |     type: "Scale"
1951 |     scale_param {
1952 |         bias_term: true
1953 |     }
1954 | }
1955 | layer {
1956 |     bottom: "layer60-conv"
1957 |     top: "layer60-conv"
1958 |     name: "layer60-act"
1959 |     type: "ReLU"
1960 |     relu_param {
1961 |         negative_slope: 0.1
1962 |     }
1963 | }
1964 | layer {
1965 |     bottom: "layer60-conv"
1966 |     top: "layer61-dwconv"
1967 |     name: "layer61-dwconv"
1968 |     type: "ConvolutionDepthwise"
1969 |     convolution_param {
1970 |         num_output: 960
1971 |         kernel_size: 3
1972 |         pad: 1
1973 |         stride: 1
1974 |         bias_term: false
1975 |     }
1976 | }
1977 | layer {
1978 |     bottom: "layer61-dwconv"
1979 |     top: "layer61-dwconv"
1980 |     name: "layer61-bn"
1981 |     type: "BatchNorm"
1982 |     batch_norm_param {
1983 |         use_global_stats: true
1984 |     }
1985 | }
1986 | layer {
1987 |     bottom: "layer61-dwconv"
1988 |     top: "layer61-dwconv"
1989 |     name: "layer61-scale"
1990 |     type: "Scale"
1991 |     scale_param {
1992 |         bias_term: true
1993 |     }
1994 | }
1995 | layer {
1996 |     bottom: "layer61-dwconv"
1997 |     top: "layer61-dwconv"
1998 |     name: "layer61-act"
1999 |     type: "ReLU"
2000 |     relu_param {
2001 |         negative_slope: 0.1
2002 |     }
2003 | }
2004 | layer {
2005 |     bottom: "layer61-dwconv"
2006 |     top: "layer62-conv"
2007 |     name: "layer62-conv"
2008 |     type: "Convolution"
2009 |     convolution_param {
2010 |         num_output: 320
2011 |         kernel_size: 1
2012 |         pad: 0
2013 |         stride: 1
2014 |         bias_term: false
2015 |     }
2016 | }
2017 | layer {
2018 |     bottom: "layer62-conv"
2019 |     top: "layer62-conv"
2020 |     name: "layer62-bn"
2021 |     type: "BatchNorm"
2022 |     batch_norm_param {
2023 |         use_global_stats: true
2024 |     }
2025 | }
2026 | layer {
2027 |     bottom: "layer62-conv"
2028 |     top: "layer62-conv"
2029 |     name: "layer62-scale"
2030 |     type: "Scale"
2031 |     scale_param {
2032 |         bias_term: true
2033 |     }
2034 | }
2035 | layer {
2036 |     bottom: "layer62-conv"
2037 |     top: "layer63-conv"
2038 |     name: "layer63-conv"
2039 |     type: "Convolution"
2040 |     convolution_param {
2041 |         num_output: 1280
2042 |         kernel_size: 1
2043 |         pad: 0
2044 |         stride: 1
2045 |         bias_term: false
2046 |     }
2047 | }
2048 | layer {
2049 |     bottom: "layer63-conv"
2050 |     top: "layer63-conv"
2051 |     name: "layer63-bn"
2052 |     type: "BatchNorm"
2053 |     batch_norm_param {
2054 |         use_global_stats: true
2055 |     }
2056 | }
2057 | layer {
2058 |     bottom: "layer63-conv"
2059 |     top: "layer63-conv"
2060 |     name: "layer63-scale"
2061 |     type: "Scale"
2062 |     scale_param {
2063 |         bias_term: true
2064 |     }
2065 | }
2066 | layer {
2067 |     bottom: "layer63-conv"
2068 |     top: "layer63-conv"
2069 |     name: "layer63-act"
2070 |     type: "ReLU"
2071 |     relu_param {
2072 |         negative_slope: 0.1
2073 |     }
2074 | }
2075 | layer {
2076 |     bottom: "layer63-conv"
2077 |     top: "layer64-conv"
2078 |     name: "layer64-conv"
2079 |     type: "Convolution"
2080 |     convolution_param {
2081 |         num_output: 512
2082 |         kernel_size: 1
2083 |         pad: 0
2084 |         stride: 1
2085 |         bias_term: false
2086 |     }
2087 | }
2088 | layer {
2089 |     bottom: "layer64-conv"
2090 |     top: "layer64-conv"
2091 |     name: "layer64-bn"
2092 |     type: "BatchNorm"
2093 |     batch_norm_param {
2094 |         use_global_stats: true
2095 |     }
2096 | }
2097 | layer {
2098 |     bottom: "layer64-conv"
2099 |     top: "layer64-conv"
2100 |     name: "layer64-scale"
2101 |     type: "Scale"
2102 |     scale_param {
2103 |         bias_term: true
2104 |     }
2105 | }
2106 | layer {
2107 |     bottom: "layer64-conv"
2108 |     top: "layer64-conv"
2109 |     name: "layer64-act"
2110 |     type: "ReLU"
2111 |     relu_param {
2112 |         negative_slope: 0.1
2113 |     }
2114 | }
2115 | layer {
2116 |     bottom: "layer64-conv"
2117 |     top: "layer65-conv"
2118 |     name: "layer65-conv"
2119 |     type: "Convolution"
2120 |     convolution_param {
2121 |         num_output: 1024
2122 |         kernel_size: 3
2123 |         pad: 1
2124 |         stride: 1
2125 |         bias_term: false
2126 |     }
2127 | }
2128 | layer {
2129 |     bottom: "layer65-conv"
2130 |     top: "layer65-conv"
2131 |     name: "layer65-bn"
2132 |     type: "BatchNorm"
2133 |     batch_norm_param {
2134 |         use_global_stats: true
2135 |     }
2136 | }
2137 | layer {
2138 |     bottom: "layer65-conv"
2139 |     top: "layer65-conv"
2140 |     name: "layer65-scale"
2141 |     type: "Scale"
2142 |     scale_param {
2143 |         bias_term: true
2144 |     }
2145 | }
2146 | layer {
2147 |     bottom: "layer65-conv"
2148 |     top: "layer65-conv"
2149 |     name: "layer65-act"
2150 |     type: "ReLU"
2151 |     relu_param {
2152 |         negative_slope: 0.1
2153 |     }
2154 | }
2155 | layer {
2156 |     bottom: "layer65-conv"
2157 |     top: "layer66-conv"
2158 |     name: "layer66-conv"
2159 |     type: "Convolution"
2160 |     convolution_param {
2161 |         num_output: 512
2162 |         kernel_size: 1
2163 |         pad: 0
2164 |         stride: 1
2165 |         bias_term: false
2166 |     }
2167 | }
2168 | layer {
2169 |     bottom: "layer66-conv"
2170 |     top: "layer66-conv"
2171 |     name: "layer66-bn"
2172 |     type: "BatchNorm"
2173 |     batch_norm_param {
2174 |         use_global_stats: true
2175 |     }
2176 | }
2177 | layer {
2178 |     bottom: "layer66-conv"
2179 |     top: "layer66-conv"
2180 |     name: "layer66-scale"
2181 |     type: "Scale"
2182 |     scale_param {
2183 |         bias_term: true
2184 |     }
2185 | }
2186 | layer {
2187 |     bottom: "layer66-conv"
2188 |     top: "layer66-conv"
2189 |     name: "layer66-act"
2190 |     type: "ReLU"
2191 |     relu_param {
2192 |         negative_slope: 0.1
2193 |     }
2194 | }
2195 | layer {
2196 |     bottom: "layer66-conv"
2197 |     top: "layer67-conv"
2198 |     name: "layer67-conv"
2199 |     type: "Convolution"
2200 |     convolution_param {
2201 |         num_output: 1024
2202 |         kernel_size: 3
2203 |         pad: 1
2204 |         stride: 1
2205 |         bias_term: false
2206 |     }
2207 | }
2208 | layer {
2209 |     bottom: "layer67-conv"
2210 |     top: "layer67-conv"
2211 |     name: "layer67-bn"
2212 |     type: "BatchNorm"
2213 |     batch_norm_param {
2214 |         use_global_stats: true
2215 |     }
2216 | }
2217 | layer {
2218 |     bottom: "layer67-conv"
2219 |     top: "layer67-conv"
2220 |     name: "layer67-scale"
2221 |     type: "Scale"
2222 |     scale_param {
2223 |         bias_term: true
2224 |     }
2225 | }
2226 | layer {
2227 |     bottom: "layer67-conv"
2228 |     top: "layer67-conv"
2229 |     name: "layer67-act"
2230 |     type: "ReLU"
2231 |     relu_param {
2232 |         negative_slope: 0.1
2233 |     }
2234 | }
2235 | layer {
2236 |     bottom: "layer67-conv"
2237 |     top: "layer68-conv"
2238 |     name: "layer68-conv"
2239 |     type: "Convolution"
2240 |     convolution_param {
2241 |         num_output: 512
2242 |         kernel_size: 1
2243 |         pad: 0
2244 |         stride: 1
2245 |         bias_term: false
2246 |     }
2247 | }
2248 | layer {
2249 |     bottom: "layer68-conv"
2250 |     top: "layer68-conv"
2251 |     name: "layer68-bn"
2252 |     type: "BatchNorm"
2253 |     batch_norm_param {
2254 |         use_global_stats: true
2255 |     }
2256 | }
2257 | layer {
2258 |     bottom: "layer68-conv"
2259 |     top: "layer68-conv"
2260 |     name: "layer68-scale"
2261 |     type: "Scale"
2262 |     scale_param {
2263 |         bias_term: true
2264 |     }
2265 | }
2266 | layer {
2267 |     bottom: "layer68-conv"
2268 |     top: "layer68-conv"
2269 |     name: "layer68-act"
2270 |     type: "ReLU"
2271 |     relu_param {
2272 |         negative_slope: 0.1
2273 |     }
2274 | }
2275 | layer {
2276 |     bottom: "layer68-conv"
2277 |     top: "layer69-conv"
2278 |     name: "layer69-conv"
2279 |     type: "Convolution"
2280 |     convolution_param {
2281 |         num_output: 1024
2282 |         kernel_size: 3
2283 |         pad: 1
2284 |         stride: 1
2285 |         bias_term: false
2286 |     }
2287 | }
2288 | layer {
2289 |     bottom: "layer69-conv"
2290 |     top: "layer69-conv"
2291 |     name: "layer69-bn"
2292 |     type: "BatchNorm"
2293 |     batch_norm_param {
2294 |         use_global_stats: true
2295 |     }
2296 | }
2297 | layer {
2298 |     bottom: "layer69-conv"
2299 |     top: "layer69-conv"
2300 |     name: "layer69-scale"
2301 |     type: "Scale"
2302 |     scale_param {
2303 |         bias_term: true
2304 |     }
2305 | }
2306 | layer {
2307 |     bottom: "layer69-conv"
2308 |     top: "layer69-conv"
2309 |     name: "layer69-act"
2310 |     type: "ReLU"
2311 |     relu_param {
2312 |         negative_slope: 0.1
2313 |     }
2314 | }
2315 | layer {
2316 |     bottom: "layer69-conv"
2317 |     top: "layer70-conv"
2318 |     name: "layer70-conv"
2319 |     type: "Convolution"
2320 |     convolution_param {
2321 |         num_output: 255
2322 |         kernel_size: 1
2323 |         pad: 0
2324 |         stride: 1
2325 |         bias_term: true
2326 |     }
2327 | }
2328 | layer {
2329 |     bottom: "layer68-conv"
2330 |     top: "layer72-route"
2331 |     name: "layer72-route"
2332 |     type: "Concat"
2333 | }
2334 | layer {
2335 |     bottom: "layer72-route"
2336 |     top: "layer73-conv"
2337 |     name: "layer73-conv"
2338 |     type: "Convolution"
2339 |     convolution_param {
2340 |         num_output: 256
2341 |         kernel_size: 1
2342 |         pad: 0
2343 |         stride: 1
2344 |         bias_term: false
2345 |     }
2346 | }
2347 | layer {
2348 |     bottom: "layer73-conv"
2349 |     top: "layer73-conv"
2350 |     name: "layer73-bn"
2351 |     type: "BatchNorm"
2352 |     batch_norm_param {
2353 |         use_global_stats: true
2354 |     }
2355 | }
2356 | layer {
2357 |     bottom: "layer73-conv"
2358 |     top: "layer73-conv"
2359 |     name: "layer73-scale"
2360 |     type: "Scale"
2361 |     scale_param {
2362 |         bias_term: true
2363 |     }
2364 | }
2365 | layer {
2366 |     bottom: "layer73-conv"
2367 |     top: "layer73-conv"
2368 |     name: "layer73-act"
2369 |     type: "ReLU"
2370 |     relu_param {
2371 |         negative_slope: 0.1
2372 |     }
2373 | }
2374 | layer {
2375 |     bottom: "layer73-conv"
2376 |     top: "layer74-upsample"
2377 |     name: "layer74-upsample"
2378 |     type: "Upsample"
2379 |     upsample_param {
2380 |         scale: 2
2381 |     }
2382 | }
2383 | layer {
2384 |     bottom: "layer74-upsample"
2385 |     bottom: "layer49-conv"
2386 |     top: "layer75-route"
2387 |     name: "layer75-route"
2388 |     type: "Concat"
2389 | }
2390 | layer {
2391 |     bottom: "layer75-route"
2392 |     top: "layer76-conv"
2393 |     name: "layer76-conv"
2394 |     type: "Convolution"
2395 |     convolution_param {
2396 |         num_output: 256
2397 |         kernel_size: 1
2398 |         pad: 0
2399 |         stride: 1
2400 |         bias_term: false
2401 |     }
2402 | }
2403 | layer {
2404 |     bottom: "layer76-conv"
2405 |     top: "layer76-conv"
2406 |     name: "layer76-bn"
2407 |     type: "BatchNorm"
2408 |     batch_norm_param {
2409 |         use_global_stats: true
2410 |     }
2411 | }
2412 | layer {
2413 |     bottom: "layer76-conv"
2414 |     top: "layer76-conv"
2415 |     name: "layer76-scale"
2416 |     type: "Scale"
2417 |     scale_param {
2418 |         bias_term: true
2419 |     }
2420 | }
2421 | layer {
2422 |     bottom: "layer76-conv"
2423 |     top: "layer76-conv"
2424 |     name: "layer76-act"
2425 |     type: "ReLU"
2426 |     relu_param {
2427 |         negative_slope: 0.1
2428 |     }
2429 | }
2430 | layer {
2431 |     bottom: "layer76-conv"
2432 |     top: "layer77-conv"
2433 |     name: "layer77-conv"
2434 |     type: "Convolution"
2435 |     convolution_param {
2436 |         num_output: 512
2437 |         kernel_size: 3
2438 |         pad: 1
2439 |         stride: 1
2440 |         bias_term: false
2441 |     }
2442 | }
2443 | layer {
2444 |     bottom: "layer77-conv"
2445 |     top: "layer77-conv"
2446 |     name: "layer77-bn"
2447 |     type: "BatchNorm"
2448 |     batch_norm_param {
2449 |         use_global_stats: true
2450 |     }
2451 | }
2452 | layer {
2453 |     bottom: "layer77-conv"
2454 |     top: "layer77-conv"
2455 |     name: "layer77-scale"
2456 |     type: "Scale"
2457 |     scale_param {
2458 |         bias_term: true
2459 |     }
2460 | }
2461 | layer {
2462 |     bottom: "layer77-conv"
2463 |     top: "layer77-conv"
2464 |     name: "layer77-act"
2465 |     type: "ReLU"
2466 |     relu_param {
2467 |         negative_slope: 0.1
2468 |     }
2469 | }
2470 | layer {
2471 |     bottom: "layer77-conv"
2472 |     top: "layer78-conv"
2473 |     name: "layer78-conv"
2474 |     type: "Convolution"
2475 |     convolution_param {
2476 |         num_output: 256
2477 |         kernel_size: 1
2478 |         pad: 0
2479 |         stride: 1
2480 |         bias_term: false
2481 |     }
2482 | }
2483 | layer {
2484 |     bottom: "layer78-conv"
2485 |     top: "layer78-conv"
2486 |     name: "layer78-bn"
2487 |     type: "BatchNorm"
2488 |     batch_norm_param {
2489 |         use_global_stats: true
2490 |     }
2491 | }
2492 | layer {
2493 |     bottom: "layer78-conv"
2494 |     top: "layer78-conv"
2495 |     name: "layer78-scale"
2496 |     type: "Scale"
2497 |     scale_param {
2498 |         bias_term: true
2499 |     }
2500 | }
2501 | layer {
2502 |     bottom: "layer78-conv"
2503 |     top: "layer78-conv"
2504 |     name: "layer78-act"
2505 |     type: "ReLU"
2506 |     relu_param {
2507 |         negative_slope: 0.1
2508 |     }
2509 | }
2510 | layer {
2511 |     bottom: "layer78-conv"
2512 |     top: "layer79-conv"
2513 |     name: "layer79-conv"
2514 |     type: "Convolution"
2515 |     convolution_param {
2516 |         num_output: 512
2517 |         kernel_size: 3
2518 |         pad: 1
2519 |         stride: 1
2520 |         bias_term: false
2521 |     }
2522 | }
2523 | layer {
2524 |     bottom: "layer79-conv"
2525 |     top: "layer79-conv"
2526 |     name: "layer79-bn"
2527 |     type: "BatchNorm"
2528 |     batch_norm_param {
2529 |         use_global_stats: true
2530 |     }
2531 | }
2532 | layer {
2533 |     bottom: "layer79-conv"
2534 |     top: "layer79-conv"
2535 |     name: "layer79-scale"
2536 |     type: "Scale"
2537 |     scale_param {
2538 |         bias_term: true
2539 |     }
2540 | }
2541 | layer {
2542 |     bottom: "layer79-conv"
2543 |     top: "layer79-conv"
2544 |     name: "layer79-act"
2545 |     type: "ReLU"
2546 |     relu_param {
2547 |         negative_slope: 0.1
2548 |     }
2549 | }
2550 | layer {
2551 |     bottom: "layer79-conv"
2552 |     top: "layer80-conv"
2553 |     name: "layer80-conv"
2554 |     type: "Convolution"
2555 |     convolution_param {
2556 |         num_output: 256
2557 |         kernel_size: 1
2558 |         pad: 0
2559 |         stride: 1
2560 |         bias_term: false
2561 |     }
2562 | }
2563 | layer {
2564 |     bottom: "layer80-conv"
2565 |     top: "layer80-conv"
2566 |     name: "layer80-bn"
2567 |     type: "BatchNorm"
2568 |     batch_norm_param {
2569 |         use_global_stats: true
2570 |     }
2571 | }
2572 | layer {
2573 |     bottom: "layer80-conv"
2574 |     top: "layer80-conv"
2575 |     name: "layer80-scale"
2576 |     type: "Scale"
2577 |     scale_param {
2578 |         bias_term: true
2579 |     }
2580 | }
2581 | layer {
2582 |     bottom: "layer80-conv"
2583 |     top: "layer80-conv"
2584 |     name: "layer80-act"
2585 |     type: "ReLU"
2586 |     relu_param {
2587 |         negative_slope: 0.1
2588 |     }
2589 | }
2590 | layer {
2591 |     bottom: "layer80-conv"
2592 |     top: "layer81-conv"
2593 |     name: "layer81-conv"
2594 |     type: "Convolution"
2595 |     convolution_param {
2596 |         num_output: 512
2597 |         kernel_size: 3
2598 |         pad: 1
2599 |         stride: 1
2600 |         bias_term: false
2601 |     }
2602 | }
2603 | layer {
2604 |     bottom: "layer81-conv"
2605 |     top: "layer81-conv"
2606 |     name: "layer81-bn"
2607 |     type: "BatchNorm"
2608 |     batch_norm_param {
2609 |         use_global_stats: true
2610 |     }
2611 | }
2612 | layer {
2613 |     bottom: "layer81-conv"
2614 |     top: "layer81-conv"
2615 |     name: "layer81-scale"
2616 |     type: "Scale"
2617 |     scale_param {
2618 |         bias_term: true
2619 |     }
2620 | }
2621 | layer {
2622 |     bottom: "layer81-conv"
2623 |     top: "layer81-conv"
2624 |     name: "layer81-act"
2625 |     type: "ReLU"
2626 |     relu_param {
2627 |         negative_slope: 0.1
2628 |     }
2629 | }
2630 | layer {
2631 |     bottom: "layer81-conv"
2632 |     top: "layer82-conv"
2633 |     name: "layer82-conv"
2634 |     type: "Convolution"
2635 |     convolution_param {
2636 |         num_output: 255
2637 |         kernel_size: 1
2638 |         pad: 0
2639 |         stride: 1
2640 |         bias_term: true
2641 |     }
2642 | }
2643 | layer {
2644 |     bottom: "layer80-conv"
2645 |     top: "layer84-route"
2646 |     name: "layer84-route"
2647 |     type: "Concat"
2648 | }
2649 | layer {
2650 |     bottom: "layer84-route"
2651 |     top: "layer85-conv"
2652 |     name: "layer85-conv"
2653 |     type: "Convolution"
2654 |     convolution_param {
2655 |         num_output: 128
2656 |         kernel_size: 1
2657 |         pad: 0
2658 |         stride: 1
2659 |         bias_term: false
2660 |     }
2661 | }
2662 | layer {
2663 |     bottom: "layer85-conv"
2664 |     top: "layer85-conv"
2665 |     name: "layer85-bn"
2666 |     type: "BatchNorm"
2667 |     batch_norm_param {
2668 |         use_global_stats: true
2669 |     }
2670 | }
2671 | layer {
2672 |     bottom: "layer85-conv"
2673 |     top: "layer85-conv"
2674 |     name: "layer85-scale"
2675 |     type: "Scale"
2676 |     scale_param {
2677 |         bias_term: true
2678 |     }
2679 | }
2680 | layer {
2681 |     bottom: "layer85-conv"
2682 |     top: "layer85-conv"
2683 |     name: "layer85-act"
2684 |     type: "ReLU"
2685 |     relu_param {
2686 |         negative_slope: 0.1
2687 |     }
2688 | }
2689 | layer {
2690 |     bottom: "layer85-conv"
2691 |     top: "layer86-upsample"
2692 |     name: "layer86-upsample"
2693 |     type: "Upsample"
2694 |     upsample_param {
2695 |         scale: 2
2696 |     }
2697 | }
2698 | layer {
2699 |     bottom: "layer86-upsample"
2700 |     bottom: "layer38-conv"
2701 |     top: "layer87-route"
2702 |     name: "layer87-route"
2703 |     type: "Concat"
2704 | }
2705 | layer {
2706 |     bottom: "layer87-route"
2707 |     top: "layer88-conv"
2708 |     name: "layer88-conv"
2709 |     type: "Convolution"
2710 |     convolution_param {
2711 |         num_output: 128
2712 |         kernel_size: 1
2713 |         pad: 0
2714 |         stride: 1
2715 |         bias_term: false
2716 |     }
2717 | }
2718 | layer {
2719 |     bottom: "layer88-conv"
2720 |     top: "layer88-conv"
2721 |     name: "layer88-bn"
2722 |     type: "BatchNorm"
2723 |     batch_norm_param {
2724 |         use_global_stats: true
2725 |     }
2726 | }
2727 | layer {
2728 |     bottom: "layer88-conv"
2729 |     top: "layer88-conv"
2730 |     name: "layer88-scale"
2731 |     type: "Scale"
2732 |     scale_param {
2733 |         bias_term: true
2734 |     }
2735 | }
2736 | layer {
2737 |     bottom: "layer88-conv"
2738 |     top: "layer88-conv"
2739 |     name: "layer88-act"
2740 |     type: "ReLU"
2741 |     relu_param {
2742 |         negative_slope: 0.1
2743 |     }
2744 | }
2745 | layer {
2746 |     bottom: "layer88-conv"
2747 |     top: "layer89-conv"
2748 |     name: "layer89-conv"
2749 |     type: "Convolution"
2750 |     convolution_param {
2751 |         num_output: 256
2752 |         kernel_size: 3
2753 |         pad: 1
2754 |         stride: 1
2755 |         bias_term: false
2756 |     }
2757 | }
2758 | layer {
2759 |     bottom: "layer89-conv"
2760 |     top: "layer89-conv"
2761 |     name: "layer89-bn"
2762 |     type: "BatchNorm"
2763 |     batch_norm_param {
2764 |         use_global_stats: true
2765 |     }
2766 | }
2767 | layer {
2768 |     bottom: "layer89-conv"
2769 |     top: "layer89-conv"
2770 |     name: "layer89-scale"
2771 |     type: "Scale"
2772 |     scale_param {
2773 |         bias_term: true
2774 |     }
2775 | }
2776 | layer {
2777 |     bottom: "layer89-conv"
2778 |     top: "layer89-conv"
2779 |     name: "layer89-act"
2780 |     type: "ReLU"
2781 |     relu_param {
2782 |         negative_slope: 0.1
2783 |     }
2784 | }
2785 | layer {
2786 |     bottom: "layer89-conv"
2787 |     top: "layer90-conv"
2788 |     name: "layer90-conv"
2789 |     type: "Convolution"
2790 |     convolution_param {
2791 |         num_output: 128
2792 |         kernel_size: 1
2793 |         pad: 0
2794 |         stride: 1
2795 |         bias_term: false
2796 |     }
2797 | }
2798 | layer {
2799 |     bottom: "layer90-conv"
2800 |     top: "layer90-conv"
2801 |     name: "layer90-bn"
2802 |     type: "BatchNorm"
2803 |     batch_norm_param {
2804 |         use_global_stats: true
2805 |     }
2806 | }
2807 | layer {
2808 |     bottom: "layer90-conv"
2809 |     top: "layer90-conv"
2810 |     name: "layer90-scale"
2811 |     type: "Scale"
2812 |     scale_param {
2813 |         bias_term: true
2814 |     }
2815 | }
2816 | layer {
2817 |     bottom: "layer90-conv"
2818 |     top: "layer90-conv"
2819 |     name: "layer90-act"
2820 |     type: "ReLU"
2821 |     relu_param {
2822 |         negative_slope: 0.1
2823 |     }
2824 | }
2825 | layer {
2826 |     bottom: "layer90-conv"
2827 |     top: "layer91-conv"
2828 |     name: "layer91-conv"
2829 |     type: "Convolution"
2830 |     convolution_param {
2831 |         num_output: 256
2832 |         kernel_size: 3
2833 |         pad: 1
2834 |         stride: 1
2835 |         bias_term: false
2836 |     }
2837 | }
2838 | layer {
2839 |     bottom: "layer91-conv"
2840 |     top: "layer91-conv"
2841 |     name: "layer91-bn"
2842 |     type: "BatchNorm"
2843 |     batch_norm_param {
2844 |         use_global_stats: true
2845 |     }
2846 | }
2847 | layer {
2848 |     bottom: "layer91-conv"
2849 |     top: "layer91-conv"
2850 |     name: "layer91-scale"
2851 |     type: "Scale"
2852 |     scale_param {
2853 |         bias_term: true
2854 |     }
2855 | }
2856 | layer {
2857 |     bottom: "layer91-conv"
2858 |     top: "layer91-conv"
2859 |     name: "layer91-act"
2860 |     type: "ReLU"
2861 |     relu_param {
2862 |         negative_slope: 0.1
2863 |     }
2864 | }
2865 | layer {
2866 |     bottom: "layer91-conv"
2867 |     top: "layer92-conv"
2868 |     name: "layer92-conv"
2869 |     type: "Convolution"
2870 |     convolution_param {
2871 |         num_output: 128
2872 |         kernel_size: 1
2873 |         pad: 0
2874 |         stride: 1
2875 |         bias_term: false
2876 |     }
2877 | }
2878 | layer {
2879 |     bottom: "layer92-conv"
2880 |     top: "layer92-conv"
2881 |     name: "layer92-bn"
2882 |     type: "BatchNorm"
2883 |     batch_norm_param {
2884 |         use_global_stats: true
2885 |     }
2886 | }
2887 | layer {
2888 |     bottom: "layer92-conv"
2889 |     top: "layer92-conv"
2890 |     name: "layer92-scale"
2891 |     type: "Scale"
2892 |     scale_param {
2893 |         bias_term: true
2894 |     }
2895 | }
2896 | layer {
2897 |     bottom: "layer92-conv"
2898 |     top: "layer92-conv"
2899 |     name: "layer92-act"
2900 |     type: "ReLU"
2901 |     relu_param {
2902 |         negative_slope: 0.1
2903 |     }
2904 | }
2905 | layer {
2906 |     bottom: "layer92-conv"
2907 |     top: "layer93-conv"
2908 |     name: "layer93-conv"
2909 |     type: "Convolution"
2910 |     convolution_param {
2911 |         num_output: 256
2912 |         kernel_size: 3
2913 |         pad: 1
2914 |         stride: 1
2915 |         bias_term: false
2916 |     }
2917 | }
2918 | layer {
2919 |     bottom: "layer93-conv"
2920 |     top: "layer93-conv"
2921 |     name: "layer93-bn"
2922 |     type: "BatchNorm"
2923 |     batch_norm_param {
2924 |         use_global_stats: true
2925 |     }
2926 | }
2927 | layer {
2928 |     bottom: "layer93-conv"
2929 |     top: "layer93-conv"
2930 |     name: "layer93-scale"
2931 |     type: "Scale"
2932 |     scale_param {
2933 |         bias_term: true
2934 |     }
2935 | }
2936 | layer {
2937 |     bottom: "layer93-conv"
2938 |     top: "layer93-conv"
2939 |     name: "layer93-act"
2940 |     type: "ReLU"
2941 |     relu_param {
2942 |         negative_slope: 0.1
2943 |     }
2944 | }
2945 | layer {
2946 |     bottom: "layer93-conv"
2947 |     top: "layer94-conv"
2948 |     name: "layer94-conv"
2949 |     type: "Convolution"
2950 |     convolution_param {
2951 |         num_output: 255
2952 |         kernel_size: 1
2953 |         pad: 0
2954 |         stride: 1
2955 |         bias_term: true
2956 |     }
2957 | }
2958 | 


--------------------------------------------------------------------------------
/prototxt/yolov3-tiny.prototxt:
--------------------------------------------------------------------------------
  1 | name: "Darkent2Caffe"
  2 | input: "data"
  3 | input_dim: 1
  4 | input_dim: 3
  5 | input_dim: 416
  6 | input_dim: 416
  7 | 
  8 | layer {
  9 |     bottom: "data"
 10 |     top: "layer1-conv"
 11 |     name: "layer1-conv"
 12 |     type: "Convolution"
 13 |     convolution_param {
 14 |         num_output: 16
 15 |         kernel_size: 3
 16 |         pad: 1
 17 |         stride: 1
 18 |         bias_term: false
 19 |     }
 20 | }
 21 | layer {
 22 |     bottom: "layer1-conv"
 23 |     top: "layer1-conv"
 24 |     name: "layer1-bn"
 25 |     type: "BatchNorm"
 26 |     batch_norm_param {
 27 |         use_global_stats: true
 28 |     }
 29 | }
 30 | layer {
 31 |     bottom: "layer1-conv"
 32 |     top: "layer1-conv"
 33 |     name: "layer1-scale"
 34 |     type: "Scale"
 35 |     scale_param {
 36 |         bias_term: true
 37 |     }
 38 | }
 39 | layer {
 40 |     bottom: "layer1-conv"
 41 |     top: "layer1-conv"
 42 |     name: "layer1-act"
 43 |     type: "ReLU"
 44 |     relu_param {
 45 |         negative_slope: 0.1
 46 |     }
 47 | }
 48 | layer {
 49 |     bottom: "layer1-conv"
 50 |     top: "layer2-maxpool"
 51 |     name: "layer2-maxpool"
 52 |     type: "Pooling"
 53 |     pooling_param {
 54 |         stride: 2
 55 |         pool: MAX
 56 |         kernel_size: 2
 57 |         pad: 0
 58 |     }
 59 | }
 60 | layer {
 61 |     bottom: "layer2-maxpool"
 62 |     top: "layer3-conv"
 63 |     name: "layer3-conv"
 64 |     type: "Convolution"
 65 |     convolution_param {
 66 |         num_output: 32
 67 |         kernel_size: 3
 68 |         pad: 1
 69 |         stride: 1
 70 |         bias_term: false
 71 |     }
 72 | }
 73 | layer {
 74 |     bottom: "layer3-conv"
 75 |     top: "layer3-conv"
 76 |     name: "layer3-bn"
 77 |     type: "BatchNorm"
 78 |     batch_norm_param {
 79 |         use_global_stats: true
 80 |     }
 81 | }
 82 | layer {
 83 |     bottom: "layer3-conv"
 84 |     top: "layer3-conv"
 85 |     name: "layer3-scale"
 86 |     type: "Scale"
 87 |     scale_param {
 88 |         bias_term: true
 89 |     }
 90 | }
 91 | layer {
 92 |     bottom: "layer3-conv"
 93 |     top: "layer3-conv"
 94 |     name: "layer3-act"
 95 |     type: "ReLU"
 96 |     relu_param {
 97 |         negative_slope: 0.1
 98 |     }
 99 | }
100 | layer {
101 |     bottom: "layer3-conv"
102 |     top: "layer4-maxpool"
103 |     name: "layer4-maxpool"
104 |     type: "Pooling"
105 |     pooling_param {
106 |         stride: 2
107 |         pool: MAX
108 |         kernel_size: 2
109 |         pad: 0
110 |     }
111 | }
112 | layer {
113 |     bottom: "layer4-maxpool"
114 |     top: "layer5-conv"
115 |     name: "layer5-conv"
116 |     type: "Convolution"
117 |     convolution_param {
118 |         num_output: 64
119 |         kernel_size: 3
120 |         pad: 1
121 |         stride: 1
122 |         bias_term: false
123 |     }
124 | }
125 | layer {
126 |     bottom: "layer5-conv"
127 |     top: "layer5-conv"
128 |     name: "layer5-bn"
129 |     type: "BatchNorm"
130 |     batch_norm_param {
131 |         use_global_stats: true
132 |     }
133 | }
134 | layer {
135 |     bottom: "layer5-conv"
136 |     top: "layer5-conv"
137 |     name: "layer5-scale"
138 |     type: "Scale"
139 |     scale_param {
140 |         bias_term: true
141 |     }
142 | }
143 | layer {
144 |     bottom: "layer5-conv"
145 |     top: "layer5-conv"
146 |     name: "layer5-act"
147 |     type: "ReLU"
148 |     relu_param {
149 |         negative_slope: 0.1
150 |     }
151 | }
152 | layer {
153 |     bottom: "layer5-conv"
154 |     top: "layer6-maxpool"
155 |     name: "layer6-maxpool"
156 |     type: "Pooling"
157 |     pooling_param {
158 |         stride: 2
159 |         pool: MAX
160 |         kernel_size: 2
161 |         pad: 0
162 |     }
163 | }
164 | layer {
165 |     bottom: "layer6-maxpool"
166 |     top: "layer7-conv"
167 |     name: "layer7-conv"
168 |     type: "Convolution"
169 |     convolution_param {
170 |         num_output: 128
171 |         kernel_size: 3
172 |         pad: 1
173 |         stride: 1
174 |         bias_term: false
175 |     }
176 | }
177 | layer {
178 |     bottom: "layer7-conv"
179 |     top: "layer7-conv"
180 |     name: "layer7-bn"
181 |     type: "BatchNorm"
182 |     batch_norm_param {
183 |         use_global_stats: true
184 |     }
185 | }
186 | layer {
187 |     bottom: "layer7-conv"
188 |     top: "layer7-conv"
189 |     name: "layer7-scale"
190 |     type: "Scale"
191 |     scale_param {
192 |         bias_term: true
193 |     }
194 | }
195 | layer {
196 |     bottom: "layer7-conv"
197 |     top: "layer7-conv"
198 |     name: "layer7-act"
199 |     type: "ReLU"
200 |     relu_param {
201 |         negative_slope: 0.1
202 |     }
203 | }
204 | layer {
205 |     bottom: "layer7-conv"
206 |     top: "layer8-maxpool"
207 |     name: "layer8-maxpool"
208 |     type: "Pooling"
209 |     pooling_param {
210 |         stride: 2
211 |         pool: MAX
212 |         kernel_size: 2
213 |         pad: 0
214 |     }
215 | }
216 | layer {
217 |     bottom: "layer8-maxpool"
218 |     top: "layer9-conv"
219 |     name: "layer9-conv"
220 |     type: "Convolution"
221 |     convolution_param {
222 |         num_output: 256
223 |         kernel_size: 3
224 |         pad: 1
225 |         stride: 1
226 |         bias_term: false
227 |     }
228 | }
229 | layer {
230 |     bottom: "layer9-conv"
231 |     top: "layer9-conv"
232 |     name: "layer9-bn"
233 |     type: "BatchNorm"
234 |     batch_norm_param {
235 |         use_global_stats: true
236 |     }
237 | }
238 | layer {
239 |     bottom: "layer9-conv"
240 |     top: "layer9-conv"
241 |     name: "layer9-scale"
242 |     type: "Scale"
243 |     scale_param {
244 |         bias_term: true
245 |     }
246 | }
247 | layer {
248 |     bottom: "layer9-conv"
249 |     top: "layer9-conv"
250 |     name: "layer9-act"
251 |     type: "ReLU"
252 |     relu_param {
253 |         negative_slope: 0.1
254 |     }
255 | }
256 | layer {
257 |     bottom: "layer9-conv"
258 |     top: "layer10-maxpool"
259 |     name: "layer10-maxpool"
260 |     type: "Pooling"
261 |     pooling_param {
262 |         stride: 2
263 |         pool: MAX
264 |         kernel_size: 2
265 |         pad: 0
266 |     }
267 | }
268 | layer {
269 |     bottom: "layer10-maxpool"
270 |     top: "layer11-conv"
271 |     name: "layer11-conv"
272 |     type: "Convolution"
273 |     convolution_param {
274 |         num_output: 512
275 |         kernel_size: 3
276 |         pad: 1
277 |         stride: 1
278 |         bias_term: false
279 |     }
280 | }
281 | layer {
282 |     bottom: "layer11-conv"
283 |     top: "layer11-conv"
284 |     name: "layer11-bn"
285 |     type: "BatchNorm"
286 |     batch_norm_param {
287 |         use_global_stats: true
288 |     }
289 | }
290 | layer {
291 |     bottom: "layer11-conv"
292 |     top: "layer11-conv"
293 |     name: "layer11-scale"
294 |     type: "Scale"
295 |     scale_param {
296 |         bias_term: true
297 |     }
298 | }
299 | layer {
300 |     bottom: "layer11-conv"
301 |     top: "layer11-conv"
302 |     name: "layer11-act"
303 |     type: "ReLU"
304 |     relu_param {
305 |         negative_slope: 0.1
306 |     }
307 | }
308 | layer {
309 |     bottom: "layer11-conv"
310 |     top: "layer12-maxpool"
311 |     name: "layer12-maxpool"
312 |     type: "Pooling"
313 |     pooling_param {
314 |         stride: 1
315 |         pool: MAX
316 |         kernel_size: 2
317 |         pad: 0
318 |     }
319 | }
320 | layer {
321 |     bottom: "layer12-maxpool"
322 |     top: "layer13-conv"
323 |     name: "layer13-conv"
324 |     type: "Convolution"
325 |     convolution_param {
326 |         num_output: 1024
327 |         kernel_size: 3
328 |         pad: 1
329 |         stride: 1
330 |         bias_term: false
331 |     }
332 | }
333 | layer {
334 |     bottom: "layer13-conv"
335 |     top: "layer13-conv"
336 |     name: "layer13-bn"
337 |     type: "BatchNorm"
338 |     batch_norm_param {
339 |         use_global_stats: true
340 |     }
341 | }
342 | layer {
343 |     bottom: "layer13-conv"
344 |     top: "layer13-conv"
345 |     name: "layer13-scale"
346 |     type: "Scale"
347 |     scale_param {
348 |         bias_term: true
349 |     }
350 | }
351 | layer {
352 |     bottom: "layer13-conv"
353 |     top: "layer13-conv"
354 |     name: "layer13-act"
355 |     type: "ReLU"
356 |     relu_param {
357 |         negative_slope: 0.1
358 |     }
359 | }
360 | layer {
361 |     bottom: "layer13-conv"
362 |     top: "layer14-conv"
363 |     name: "layer14-conv"
364 |     type: "Convolution"
365 |     convolution_param {
366 |         num_output: 256
367 |         kernel_size: 1
368 |         pad: 0
369 |         stride: 1
370 |         bias_term: false
371 |     }
372 | }
373 | layer {
374 |     bottom: "layer14-conv"
375 |     top: "layer14-conv"
376 |     name: "layer14-bn"
377 |     type: "BatchNorm"
378 |     batch_norm_param {
379 |         use_global_stats: true
380 |     }
381 | }
382 | layer {
383 |     bottom: "layer14-conv"
384 |     top: "layer14-conv"
385 |     name: "layer14-scale"
386 |     type: "Scale"
387 |     scale_param {
388 |         bias_term: true
389 |     }
390 | }
391 | layer {
392 |     bottom: "layer14-conv"
393 |     top: "layer14-conv"
394 |     name: "layer14-act"
395 |     type: "ReLU"
396 |     relu_param {
397 |         negative_slope: 0.1
398 |     }
399 | }
400 | layer {
401 |     bottom: "layer14-conv"
402 |     top: "layer15-conv"
403 |     name: "layer15-conv"
404 |     type: "Convolution"
405 |     convolution_param {
406 |         num_output: 512
407 |         kernel_size: 3
408 |         pad: 1
409 |         stride: 1
410 |         bias_term: false
411 |     }
412 | }
413 | layer {
414 |     bottom: "layer15-conv"
415 |     top: "layer15-conv"
416 |     name: "layer15-bn"
417 |     type: "BatchNorm"
418 |     batch_norm_param {
419 |         use_global_stats: true
420 |     }
421 | }
422 | layer {
423 |     bottom: "layer15-conv"
424 |     top: "layer15-conv"
425 |     name: "layer15-scale"
426 |     type: "Scale"
427 |     scale_param {
428 |         bias_term: true
429 |     }
430 | }
431 | layer {
432 |     bottom: "layer15-conv"
433 |     top: "layer15-conv"
434 |     name: "layer15-act"
435 |     type: "ReLU"
436 |     relu_param {
437 |         negative_slope: 0.1
438 |     }
439 | }
440 | layer {
441 |     bottom: "layer15-conv"
442 |     top: "layer16-conv"
443 |     name: "layer16-conv"
444 |     type: "Convolution"
445 |     convolution_param {
446 |         num_output: 255
447 |         kernel_size: 1
448 |         pad: 0
449 |         stride: 1
450 |         bias_term: true
451 |     }
452 | }
453 | layer {
454 |     bottom: "layer14-conv"
455 |     top: "layer18-route"
456 |     name: "layer18-route"
457 |     type: "Concat"
458 | }
459 | layer {
460 |     bottom: "layer18-route"
461 |     top: "layer19-conv"
462 |     name: "layer19-conv"
463 |     type: "Convolution"
464 |     convolution_param {
465 |         num_output: 128
466 |         kernel_size: 1
467 |         pad: 0
468 |         stride: 1
469 |         bias_term: false
470 |     }
471 | }
472 | layer {
473 |     bottom: "layer19-conv"
474 |     top: "layer19-conv"
475 |     name: "layer19-bn"
476 |     type: "BatchNorm"
477 |     batch_norm_param {
478 |         use_global_stats: true
479 |     }
480 | }
481 | layer {
482 |     bottom: "layer19-conv"
483 |     top: "layer19-conv"
484 |     name: "layer19-scale"
485 |     type: "Scale"
486 |     scale_param {
487 |         bias_term: true
488 |     }
489 | }
490 | layer {
491 |     bottom: "layer19-conv"
492 |     top: "layer19-conv"
493 |     name: "layer19-act"
494 |     type: "ReLU"
495 |     relu_param {
496 |         negative_slope: 0.1
497 |     }
498 | }
499 | layer {
500 |     bottom: "layer19-conv"
501 |     top: "layer20-upsample"
502 |     name: "layer20-upsample"
503 |     type: "Upsample"
504 |     upsample_param {
505 |         scale: 2
506 |     }
507 | }
508 | layer {
509 |     bottom: "layer20-upsample"
510 |     bottom: "layer9-conv"
511 |     top: "layer21-route"
512 |     name: "layer21-route"
513 |     type: "Concat"
514 | }
515 | layer {
516 |     bottom: "layer21-route"
517 |     top: "layer22-conv"
518 |     name: "layer22-conv"
519 |     type: "Convolution"
520 |     convolution_param {
521 |         num_output: 256
522 |         kernel_size: 3
523 |         pad: 1
524 |         stride: 1
525 |         bias_term: false
526 |     }
527 | }
528 | layer {
529 |     bottom: "layer22-conv"
530 |     top: "layer22-conv"
531 |     name: "layer22-bn"
532 |     type: "BatchNorm"
533 |     batch_norm_param {
534 |         use_global_stats: true
535 |     }
536 | }
537 | layer {
538 |     bottom: "layer22-conv"
539 |     top: "layer22-conv"
540 |     name: "layer22-scale"
541 |     type: "Scale"
542 |     scale_param {
543 |         bias_term: true
544 |     }
545 | }
546 | layer {
547 |     bottom: "layer22-conv"
548 |     top: "layer22-conv"
549 |     name: "layer22-act"
550 |     type: "ReLU"
551 |     relu_param {
552 |         negative_slope: 0.1
553 |     }
554 | }
555 | layer {
556 |     bottom: "layer22-conv"
557 |     top: "layer23-conv"
558 |     name: "layer23-conv"
559 |     type: "Convolution"
560 |     convolution_param {
561 |         num_output: 255
562 |         kernel_size: 1
563 |         pad: 0
564 |         stride: 1
565 |         bias_term: true
566 |     }
567 | }
568 | 


--------------------------------------------------------------------------------
/src/activation_kernels.cu:
--------------------------------------------------------------------------------
 1 | /*
 2 |  * Company:	Synthesis
 3 |  * Author: 	Chen
 4 |  * Date:	2018/06/04
 5 |  */
 6 | #include "activations.h"
 7 | #include "cuda.h"
 8 | #include "blas.h"
 9 | 
10 | 
11 | 
12 | __device__ float lhtan_activate_kernel(float x)
13 | {
14 |     if(x < 0) return .001f*x;
15 |     if(x > 1) return .001f*(x-1.f) + 1.f;
16 |     return x;
17 | }
18 | 
19 | __device__ float hardtan_activate_kernel(float x)
20 | {
21 |     if (x < -1) return -1;
22 |     if (x > 1) return 1;
23 |     return x;
24 | }
25 | 
26 | __device__ float linear_activate_kernel(float x){return x;}
27 | __device__ float logistic_activate_kernel(float x){return 1.f/(1.f + expf(-x));}
28 | __device__ float loggy_activate_kernel(float x){return 2.f/(1.f + expf(-x)) - 1;}
29 | __device__ float relu_activate_kernel(float x){return x*(x>0);}
30 | __device__ float elu_activate_kernel(float x){return (x >= 0)*x + (x < 0)*(expf(x)-1);}
31 | __device__ float relie_activate_kernel(float x){return (x>0) ? x : .01f*x;}
32 | __device__ float ramp_activate_kernel(float x){return x*(x>0)+.1f*x;}
33 | __device__ float leaky_activate_kernel(float x){return (x>0) ? x : .1f*x;}
34 | __device__ float tanh_activate_kernel(float x){return (2.f/(1 + expf(-2*x)) - 1);}
35 | __device__ float plse_activate_kernel(float x)
36 | {
37 |     if(x < -4) return .01f * (x + 4);
38 |     if(x > 4)  return .01f * (x - 4) + 1;
39 |     return .125f*x + .5f;
40 | }
41 | __device__ float stair_activate_kernel(float x)
42 | {
43 |     int n = floorf(x);
44 |     if (n%2 == 0) return floorf(x/2);
45 |     else return (x - n) + floorf(x/2);
46 | }
47 | 
48 | __device__ float activate_kernel(float x, ACTIVATION a)
49 | {
50 |     switch(a){
51 |         case LINEAR:
52 |             return linear_activate_kernel(x);
53 |         case LOGISTIC:
54 |             return logistic_activate_kernel(x);
55 |         case LOGGY:
56 |             return loggy_activate_kernel(x);
57 |         case RELU:
58 |             return relu_activate_kernel(x);
59 |         case ELU:
60 |             return elu_activate_kernel(x);
61 |         case RELIE:
62 |             return relie_activate_kernel(x);
63 |         case RAMP:
64 |             return ramp_activate_kernel(x);
65 |         case LEAKY:
66 |             return leaky_activate_kernel(x);
67 |         case TANH:
68 |             return tanh_activate_kernel(x);
69 |         case PLSE:
70 |             return plse_activate_kernel(x);
71 |         case STAIR:
72 |             return stair_activate_kernel(x);
73 |         case HARDTAN:
74 |             return hardtan_activate_kernel(x);
75 |         case LHTAN:
76 |             return lhtan_activate_kernel(x);
77 |     }
78 |     return 0;
79 | }
80 | 
81 | __global__ void activate_array_kernel(float *x, int n, ACTIVATION a)
82 | {
83 |     int i = (blockIdx.x + blockIdx.y*gridDim.x) * blockDim.x + threadIdx.x;
84 |     if(i < n) x[i] = activate_kernel(x[i], a);
85 | }
86 | 
87 | void activate_array_gpu(float *x, int n, ACTIVATION a)
88 | {
89 |     activate_array_kernel<<<cuda_gridsize(n), BLOCK>>>(x, n, a);
90 |     check_error(cudaPeekAtLastError());
91 | }
92 | 


--------------------------------------------------------------------------------
/src/activations.h:
--------------------------------------------------------------------------------
 1 | /*
 2 |  * Company:	Synthesis
 3 |  * Author: 	Chen
 4 |  * Date:	2018/06/04
 5 |  */
 6 | 
 7 | #ifndef __ACTIVATIONS_H_
 8 | #define __ACTIVATIONS_H_
 9 | 
10 | typedef enum{
11 |     LOGISTIC, RELU, RELIE, LINEAR, RAMP, TANH, PLSE, LEAKY, ELU, LOGGY, STAIR, HARDTAN, LHTAN
12 | } ACTIVATION;
13 | 
14 | void activate_array_gpu(float* x,int n,ACTIVATION a);
15 | 
16 | #endif
17 | 


--------------------------------------------------------------------------------
/src/blas.h:
--------------------------------------------------------------------------------
 1 | /*
 2 |  * Company:	Synthesis
 3 |  * Author: 	Chen
 4 |  * Date:	2018/06/04
 5 |  */
 6 | 
 7 | #ifndef __BLAS_H_
 8 | #define __BLAS_H_
 9 | 
10 | void copy_gpu(int N,float* X,int INCX,float* Y,int INCY);
11 | 
12 | void fill_gpu(int N, float ALPHA, float * X, int INCX);
13 | 
14 | #endif
15 | 


--------------------------------------------------------------------------------
/src/blas_kernels.cu:
--------------------------------------------------------------------------------
 1 | /*
 2 |  * Company:	Synthesis
 3 |  * Author: 	Chen
 4 |  * Date:	2018/06/04
 5 |  */
 6 | 
 7 | 
 8 | #include <assert.h>
 9 | 
10 | #include "cuda.h"
11 | #include "blas.h"
12 | 
13 | __global__ void copy_kernel(int N,float* X,int OFFX,int INCX,float* Y,int OFFY,int INCY)
14 | {
15 |     int i = (blockIdx.x + blockIdx.y*gridDim.x) * blockDim.x + threadIdx.x;
16 |     if(i < N) Y[i*INCY + OFFY] = X[i*INCX + OFFX];
17 | }
18 | 
19 | __global__ void fill_kernel(int N, float ALPHA, float *X, int INCX)
20 | {
21 |     int i = (blockIdx.x + blockIdx.y*gridDim.x) * blockDim.x + threadIdx.x;
22 |     if(i < N) X[i*INCX] = ALPHA;
23 | }
24 | 
25 | void copy_gpu_offset(int N,float* X,int OFFX,int INCX,float* Y,int OFFY,int INCY)
26 | {
27 |     copy_kernel<<<cuda_gridsize(N),BLOCK>>>(N,X,OFFX,INCX,Y,OFFY,INCY);
28 |     check_error(cudaPeekAtLastError());
29 | }
30 | 
31 | void copy_gpu(int N,float* X,int INCX,float* Y,int INCY)
32 | {
33 |     copy_gpu_offset(N,X,0,INCX,Y,0,INCY);
34 | }
35 | 
36 | 
37 | void fill_gpu(int N, float ALPHA, float * X, int INCX)
38 | {
39 |     fill_kernel<<<cuda_gridsize(N), BLOCK>>>(N, ALPHA, X, INCX);
40 |     check_error(cudaPeekAtLastError());
41 | }
42 | 


--------------------------------------------------------------------------------
/src/box.cpp:
--------------------------------------------------------------------------------
 1 | #include "box.h"
 2 | #include <stdio.h>
 3 | #include <math.h>
 4 | #include <stdlib.h>
 5 | 
 6 | int nms_comparator(const void *pa, const void *pb)
 7 | {
 8 |     detection a = *(detection *)pa;
 9 |     detection b = *(detection *)pb;
10 |     float diff = 0;
11 |     if(b.sort_class >= 0){
12 |         diff = a.prob[b.sort_class] - b.prob[b.sort_class];
13 |     } else {
14 |         diff = a.objectness - b.objectness;
15 |     }
16 |     if(diff < 0) return 1;
17 |     else if(diff > 0) return -1;
18 |     return 0;
19 | }
20 | 
21 | float overlap(float x1, float w1, float x2, float w2)
22 | {
23 |     float l1 = x1 - w1/2;
24 |     float l2 = x2 - w2/2;
25 |     float left = l1 > l2 ? l1 : l2;
26 |     float r1 = x1 + w1/2;
27 |     float r2 = x2 + w2/2;
28 |     float right = r1 < r2 ? r1 : r2;
29 |     return right - left;
30 | }
31 | 
32 | float box_intersection(box a, box b)
33 | {
34 |     float w = overlap(a.x, a.w, b.x, b.w);
35 |     float h = overlap(a.y, a.h, b.y, b.h);
36 |     if(w < 0 || h < 0) return 0;
37 |     float area = w*h;
38 |     return area;
39 | }
40 | 
41 | float box_union(box a, box b)
42 | {
43 |     float i = box_intersection(a, b);
44 |     float u = a.w*a.h + b.w*b.h - i;
45 |     return u;
46 | }
47 | 
48 | float box_iou(box a, box b)
49 | {
50 |     return box_intersection(a, b)/box_union(a, b);
51 | }
52 | 
53 | void do_nms_sort(detection *dets, int total, int classes, float thresh)
54 | {
55 |     int i, j, k;
56 |     k = total-1;
57 |     for(i = 0; i <= k; ++i){
58 |         if(dets[i].objectness == 0){
59 |             detection swap = dets[i];
60 |             dets[i] = dets[k];
61 |             dets[k] = swap;
62 |             --k;
63 |             --i;
64 |         }
65 |     }
66 |     total = k+1;
67 | 
68 |     for(k = 0; k < classes; ++k){
69 |         for(i = 0; i < total; ++i){
70 |             dets[i].sort_class = k;
71 |         }
72 |         qsort(dets, total, sizeof(detection), nms_comparator);
73 |         for(i = 0; i < total; ++i){
74 |             if(dets[i].prob[k] == 0) continue;
75 |             box a = dets[i].bbox;
76 |             for(j = i+1; j < total; ++j){
77 |                 box b = dets[j].bbox;
78 |                 if (box_iou(a, b) > thresh){
79 |                     dets[j].prob[k] = 0;
80 |                 }
81 |             }
82 |         }
83 |     }
84 | }
85 | 


--------------------------------------------------------------------------------
/src/box.h:
--------------------------------------------------------------------------------
 1 | /*
 2 |  * Company:	Synthesis
 3 |  * Author: 	Chen
 4 |  * Date:	2018/06/04
 5 |  */
 6 | 
 7 | #ifndef __BOX_H_
 8 | #define __BOX_H_
 9 | #include "yolo_layer.h"
10 | 
11 | 
12 | void do_nms_sort(detection *dets, int total, int classes, float thresh);
13 | 
14 | 
15 | #endif
16 | 


--------------------------------------------------------------------------------
/src/cuda.cpp:
--------------------------------------------------------------------------------
 1 | /*
 2 |  * Company:	Synthesis
 3 |  * Author: 	Chen
 4 |  * Date:	2018/06/04
 5 |  */
 6 | #include "cuda.h"
 7 | #include "blas.h"
 8 | 
 9 | #include <assert.h>
10 | #include <stdlib.h>
11 | #include <time.h>
12 | #include <stdio.h>
13 | 
14 | void error(const char* s)
15 | {
16 |     perror(s);
17 |     assert(0);
18 |     exit(-1);
19 | }
20 | 
21 | void check_error(cudaError_t status)
22 | {
23 |     //cudaDeviceSynchronize();
24 |     cudaError_t status2 = cudaGetLastError();
25 |     if (status != cudaSuccess)
26 |     {   
27 |         const char *s = cudaGetErrorString(status);
28 |         char buffer[256];
29 |         printf("CUDA Error: %s\n", s);
30 |         assert(0);
31 |         snprintf(buffer, 256, "CUDA Error: %s", s);
32 |         error(buffer);
33 |     } 
34 |     if (status2 != cudaSuccess)
35 |     {   
36 |         const char *s = cudaGetErrorString(status);
37 |         char buffer[256];
38 |         printf("CUDA Error Prev: %s\n", s);
39 |         assert(0);
40 |         snprintf(buffer, 256, "CUDA Error Prev: %s", s);
41 |         error(buffer);
42 |     } 
43 | }
44 | 
45 | dim3 cuda_gridsize(size_t n){
46 |     size_t k = (n-1) / BLOCK + 1;
47 |     size_t x = k;
48 |     size_t y = 1;
49 |     if(x > 65535){
50 |         x = ceil(sqrt(k));
51 |         y = (n-1)/(x*BLOCK) + 1;
52 |     }
53 |     dim3 d = {x, y, 1};
54 |     //printf("%ld %ld %ld %ld\n", n, x, y, x*y*BLOCK);
55 |     return d;
56 | }
57 | 
58 | float* cuda_make_array(float* x,size_t n)
59 | {
60 |     float *x_gpu;
61 |     size_t size = sizeof(float)*n;
62 |     cudaError_t status = cudaMalloc((void **)&x_gpu, size);
63 |     check_error(status);
64 |     if(x){
65 |         status = cudaMemcpy(x_gpu, x, size, cudaMemcpyHostToDevice);
66 |         check_error(status);
67 |     } else {
68 |         fill_gpu(n, 0, x_gpu, 1);
69 |     }
70 |     if(!x_gpu) error("Cuda malloc failed\n");
71 |     return x_gpu;
72 | }
73 | 
74 | void cuda_free(float* x_gpu)
75 | {
76 |     cudaError_t status = cudaFree(x_gpu);
77 |     check_error(status);
78 | }
79 | 
80 | void cuda_push_array(float *x_gpu,float* x,size_t n)
81 | {
82 |     size_t size = sizeof(float)*n;
83 |     cudaError_t status = cudaMemcpy(x_gpu,x,size,cudaMemcpyHostToDevice);
84 |     check_error(status);
85 | }
86 | 
87 | 
88 | 
89 | void cuda_pull_array(float *x_gpu,float* x,size_t n)
90 | {
91 |     size_t size = sizeof(float)*n;
92 |     cudaError_t status = cudaMemcpy(x,x_gpu,size,cudaMemcpyDeviceToHost);
93 |     check_error(status);
94 | }
95 | 


--------------------------------------------------------------------------------
/src/cuda.h:
--------------------------------------------------------------------------------
 1 | /*
 2 |  * Company:	Synthesis
 3 |  * Author: 	Chen
 4 |  * Date:	2018/06/04
 5 |  */
 6 | 
 7 | #ifndef __CUDA_H_
 8 | #define __CUDA_H_
 9 | #include "cuda_runtime.h"
10 | #include "curand.h"
11 | #include "cublas_v2.h"
12 | 
13 | #define BLOCK 512
14 | 
15 | void check_error(cudaError_t status);
16 | 
17 | dim3 cuda_gridsize(size_t n);
18 | 
19 | float* cuda_make_array(float* x,size_t n);
20 | 
21 | void cuda_free(float* x_gpu);
22 | 
23 | void cuda_push_array(float *x_gpu,float* x,size_t n);
24 | 
25 | void cuda_pull_array(float *x_gpu,float* x,size_t n);
26 | 
27 | 
28 | #endif
29 | 


--------------------------------------------------------------------------------
/src/detector.cpp:
--------------------------------------------------------------------------------
  1 | /*
  2 |  * Company:	Synthesis
  3 |  * Author: 	Chen
  4 |  * Date:	2020/04/26	
  5 |  */
  6 | 
  7 |  #include "detector.h"
  8 | 
  9 | int max_index(float *a, int n)
 10 | {
 11 |     if(n <= 0) return -1;
 12 |     int i, max_i = 0;
 13 |     float max = a[0];
 14 |     for(i = 1; i < n; ++i){
 15 |         if(a[i] > max){
 16 |             max = a[i];
 17 |             max_i = i;
 18 |         }
 19 |     }
 20 |     return max_i;
 21 | }
 22 | 
 23 |  Detector::Detector(std::string prototxt,std::string caffemodel,int gpu_id){
 24 |      // set device
 25 |     Caffe::set_mode(Caffe::GPU);
 26 | 
 27 |     if (gpu_id >= 0){
 28 |         Caffe::SetDevice(gpu_id);
 29 |         LOG(INFO) << "Using GPU #" << gpu_id;
 30 |     }
 31 |     else{
 32 |         LOG(ERROR) << "Not supported CPU!";
 33 |     }
 34 | 
 35 |     /* load and init network. */
 36 |     m_net.reset(new Net<float>(prototxt, TEST));
 37 |     m_net->CopyTrainedLayersFrom(caffemodel);
 38 |     LOG(INFO) << "net inputs numbers is " << m_net->num_inputs();
 39 |     LOG(INFO) << "net outputs numbers is " << m_net->num_outputs();
 40 | 
 41 |     CHECK_EQ(m_net->num_inputs(), 1) << "Network should have exactly one input.";
 42 | 
 43 |     m_net_input_data_blobs = m_net->input_blobs()[0];
 44 |     LOG(INFO) << "input data layer channels is  " << m_net_input_data_blobs->channels();
 45 |     LOG(INFO) << "input data layer width is  " << m_net_input_data_blobs->width();
 46 |     LOG(INFO) << "input data layer height is  " << m_net_input_data_blobs->height();
 47 | 
 48 |     
 49 | 
 50 |  }
 51 | 
 52 | Detector::~Detector(){
 53 | 
 54 |     //release memory
 55 |     // free_image(m_sized);
 56 |     // free_image(m_im);
 57 | 
 58 | }
 59 | 
 60 | 
 61 | 
 62 | 
 63 | std::vector<bbox_t> Detector::detect(std::string image_path,float thresh){
 64 |     //load image
 65 |     image im = load_image_color((char*)image_path.c_str(),0,0);
 66 |     image sized = letterbox_image(im,m_net_input_data_blobs->width(),m_net_input_data_blobs->height());
 67 | 
 68 |     //copy data from cpu to gpu
 69 |     int size = m_net_input_data_blobs->channels()*m_net_input_data_blobs->width()*m_net_input_data_blobs->height();
 70 |     cuda_push_array(m_net_input_data_blobs->mutable_gpu_data(),sized.data,size);
 71 | 
 72 |     //clean blobs
 73 |     m_blobs.clear();
 74 |         
 75 |     int nboxes = 0;
 76 |     detection *dets = NULL;
 77 | 
 78 |     // forward
 79 |     m_net->Forward();
 80 |     for(int i =0;i<m_net->num_outputs();++i){
 81 |         m_blobs.push_back(m_net->output_blobs()[i]);
 82 |     }
 83 | 
 84 |     dets = get_detections(m_blobs,im.w,im.h,
 85 |         m_net_input_data_blobs->width(),m_net_input_data_blobs->height(),m_thresh, m_classes, &nboxes);
 86 | 
 87 |     //deal with results
 88 |     std::vector<bbox_t> bbox_vec;
 89 |     for (int i = 0; i < nboxes; ++i) {
 90 |         box b = dets[i].bbox;
 91 |         int const obj_id = max_index(dets[i].prob, m_classes);
 92 |         float const prob = dets[i].prob[obj_id];
 93 | 
 94 |         if (prob > thresh)
 95 |         {
 96 |             bbox_t bbox;
 97 |             bbox.x = std::max((double)0, (b.x - b.w / 2.)*im.w);
 98 |             bbox.y = std::max((double)0, (b.y - b.h / 2.)*im.h);
 99 |             bbox.w = b.w*im.w;
100 |             bbox.h = b.h*im.h;
101 |             bbox.obj_id = obj_id;
102 |             bbox.prob = prob;
103 | 
104 |             bbox_vec.push_back(bbox);
105 |         }
106 |     }
107 | 
108 |     free_detections(dets,nboxes);
109 |     free_image(sized);
110 |     free_image(im);
111 |     return bbox_vec;
112 | }
113 | 
114 | 
115 | 
116 | std::vector<bbox_t> Detector::detect(cv::Mat mat,float thresh){
117 |     //convert mat to image
118 |     if(mat.data == NULL)
119 |         throw std::runtime_error("Mat is empty");
120 |     image im = mat_to_image(mat);
121 |     image sized = letterbox_image(im,m_net_input_data_blobs->width(),m_net_input_data_blobs->height());
122 | 
123 |     //copy data from cpu to gpu
124 |     int size = m_net_input_data_blobs->channels()*m_net_input_data_blobs->width()*m_net_input_data_blobs->height();
125 |     cuda_push_array(m_net_input_data_blobs->mutable_gpu_data(),sized.data,size);
126 | 
127 |     //clean blobs
128 |     m_blobs.clear();
129 |         
130 |     int nboxes = 0;
131 |     detection *dets = NULL;
132 | 
133 |     // forward
134 |     m_net->Forward();
135 |     for(int i =0;i<m_net->num_outputs();++i){
136 |         m_blobs.push_back(m_net->output_blobs()[i]);
137 |     }
138 | 
139 |     dets = get_detections(m_blobs,im.w,im.h,
140 |         m_net_input_data_blobs->width(),m_net_input_data_blobs->height(),m_thresh, m_classes, &nboxes);
141 | 
142 |     //deal with results
143 |     std::vector<bbox_t> bbox_vec;
144 |     for (int i = 0; i < nboxes; ++i) {
145 |         box b = dets[i].bbox;
146 |         int const obj_id = max_index(dets[i].prob, m_classes);
147 |         float const prob = dets[i].prob[obj_id];
148 | 
149 |         if (prob > thresh)
150 |         {
151 |             bbox_t bbox;
152 |             bbox.x = std::max((double)0, (b.x - b.w / 2.)*im.w);
153 |             bbox.y = std::max((double)0, (b.y - b.h / 2.)*im.h);
154 |             bbox.w = b.w*im.w;
155 |             bbox.h = b.h*im.h;
156 |             bbox.obj_id = obj_id;
157 |             bbox.prob = prob;
158 | 
159 |             bbox_vec.push_back(bbox);
160 |         }
161 |     }
162 | 
163 |     free_detections(dets,nboxes);
164 |     free_image(sized);
165 |     free_image(im);
166 |     return bbox_vec;
167 | }
168 | 


--------------------------------------------------------------------------------
/src/detector.h:
--------------------------------------------------------------------------------
 1 | /*
 2 |  * Company:	Synthesis
 3 |  * Author: 	Chen
 4 |  * Date:	2020/04/26	
 5 |  */
 6 | #include <string>
 7 | #include <vector>
 8 | #include <iostream>
 9 | #include <glog/logging.h>
10 | 
11 | #include <caffe/caffe.hpp>
12 | 
13 | 
14 | #include "image_opencv.h"
15 | #include "yolo_layer.h"
16 | 
17 | using namespace caffe;
18 | // using namespace cv;
19 | 
20 | 
21 | struct bbox_t{
22 |     unsigned int x,y,w,h;   //(x,y) - top-left corner, (w,h) - width & height of bounded box
23 |     float prob;             // confidence - probability that the object was found correctly
24 |     unsigned int obj_id;    // class of object - from range [0,classes - 1]
25 | };
26 | 
27 | class Detector{
28 | public:
29 |     Detector(std::string prototxt,std::string caffemodel,int gpu_id);
30 |     ~Detector();
31 | 
32 |     std::vector<bbox_t> detect(std::string image_path,float thresh);
33 |     std::vector<bbox_t> detect(cv::Mat mat,float thresh);
34 | 
35 | private:
36 |     shared_ptr<Net<float> > m_net;
37 |     Blob<float> * m_net_input_data_blobs;
38 |     vector<Blob<float>*> m_blobs;
39 | 
40 |     float m_thresh = 0.001;
41 |     int m_classes = 80; //coco classes
42 | };
43 | 


--------------------------------------------------------------------------------
/src/image.cpp:
--------------------------------------------------------------------------------
  1 | 
  2 | #include "image.h"
  3 | 
  4 | #include <opencv2/opencv.hpp>
  5 | 
  6 | using namespace cv;
  7 | 
  8 | void rgbgr_image(image im)
  9 | {
 10 |     int i;
 11 |     for(i = 0; i < im.w*im.h; ++i){
 12 |         float swap = im.data[i];
 13 |         im.data[i] = im.data[i+im.w*im.h*2];
 14 |         im.data[i+im.w*im.h*2] = swap;
 15 |     }
 16 | }
 17 | 
 18 | void ipl_into_image(IplImage* src, image im)
 19 | {
 20 |     unsigned char *data = (unsigned char *)src->imageData;
 21 |     int h = src->height;
 22 |     int w = src->width;
 23 |     int c = src->nChannels;
 24 |     int step = src->widthStep;
 25 |     int i, j, k;
 26 | 
 27 |     for(i = 0; i < h; ++i){
 28 |         for(k= 0; k < c; ++k){
 29 |             for(j = 0; j < w; ++j){
 30 |                 im.data[k*w*h + i*w + j] = data[i*step + j*c + k]/255.;
 31 |             }
 32 |         }
 33 |     }
 34 | }
 35 | 
 36 | image make_empty_image(int w, int h, int c)
 37 | {
 38 |     image out;
 39 |     out.data = 0;
 40 |     out.h = h;
 41 |     out.w = w;
 42 |     out.c = c;
 43 |     return out;
 44 | }
 45 | 
 46 | image make_image(int w, int h, int c)
 47 | {
 48 |     image out = make_empty_image(w,h,c);
 49 |     out.data = (float*)calloc(h*w*c, sizeof(float));
 50 |     return out;
 51 | }
 52 | 
 53 | image ipl_to_image(IplImage* src)
 54 | {
 55 |     int h = src->height;
 56 |     int w = src->width;
 57 |     int c = src->nChannels;
 58 |     image out = make_image(w, h, c);
 59 |     ipl_into_image(src, out);
 60 |     return out;
 61 | }
 62 | 
 63 | 
 64 | 
 65 | 
 66 | 
 67 | image load_image_cv(char *filename, int channels)
 68 | {
 69 |     IplImage* src = 0;
 70 |     int flag = -1;
 71 |     if (channels == 0) flag = -1;
 72 |     else if (channels == 1) flag = 0;
 73 |     else if (channels == 3) flag = 1;
 74 |     else {
 75 |         fprintf(stderr, "OpenCV can't force load with %d channels\n", channels);
 76 |     }
 77 | 
 78 |     if( (src = cvLoadImage(filename, flag)) == 0 )
 79 |     {
 80 |         fprintf(stderr, "Cannot load image \"%s\"\n", filename);
 81 |         char buff[256];
 82 |         sprintf(buff, "echo %s >> bad.list", filename);
 83 |         system(buff);
 84 |         return make_image(10,10,3);
 85 |         //exit(0);
 86 |     }
 87 |     image out = ipl_to_image(src);
 88 |     cvReleaseImage(&src);
 89 |     rgbgr_image(out);
 90 |     return out;
 91 | }
 92 | 
 93 | void free_image(image m)
 94 | {
 95 |     if(m.data){
 96 |         free(m.data);
 97 |     }
 98 | }
 99 | 
100 | image resize_image(image im, int w, int h)
101 | {
102 |     image resized = make_image(w, h, im.c);
103 |     image part = make_image(w, im.h, im.c);
104 |     int r, c, k;
105 |     float w_scale = (float)(im.w - 1) / (w - 1);
106 |     float h_scale = (float)(im.h - 1) / (h - 1);
107 |     for(k = 0; k < im.c; ++k){
108 |         for(r = 0; r < im.h; ++r){
109 |             for(c = 0; c < w; ++c){
110 |                 float val = 0;
111 |                 if(c == w-1 || im.w == 1){
112 |                     val = get_pixel(im, im.w-1, r, k);
113 |                 } else {
114 |                     float sx = c*w_scale;
115 |                     int ix = (int) sx;
116 |                     float dx = sx - ix;
117 |                     val = (1 - dx) * get_pixel(im, ix, r, k) + dx * get_pixel(im, ix+1, r, k);
118 |                 }
119 |                 set_pixel(part, c, r, k, val);
120 |             }
121 |         }
122 |     }
123 |     for(k = 0; k < im.c; ++k){
124 |         for(r = 0; r < h; ++r){
125 |             float sy = r*h_scale;
126 |             int iy = (int) sy;
127 |             float dy = sy - iy;
128 |             for(c = 0; c < w; ++c){
129 |                 float val = (1-dy) * get_pixel(part, c, iy, k);
130 |                 set_pixel(resized, c, r, k, val);
131 |             }
132 |             if(r == h-1 || im.h == 1) continue;
133 |             for(c = 0; c < w; ++c){
134 |                 float val = dy * get_pixel(part, c, iy+1, k);
135 |                 add_pixel(resized, c, r, k, val);
136 |             }
137 |         }
138 |     }
139 | 
140 |     free_image(part);
141 |     return resized;
142 | }
143 | 
144 | image load_image(char* filename,int w,int h,int c)
145 | {
146 |     image out = load_image_cv(filename,c);
147 | 
148 |     if((h && w) && (h != out.h || w != out.w))
149 |     {
150 |         image resized = resize_image(out,w,h);
151 |         free_image(out);
152 |         out = resized;
153 |     }
154 |     return out;
155 | }
156 | 
157 | image load_image_color(char* filename,int w,int h)
158 | {
159 |     return load_image(filename,w,h,3);
160 | }
161 | 
162 | void fill_image(image m, float s)
163 | {
164 |     int i;
165 |     for(i = 0; i < m.h*m.w*m.c; ++i) m.data[i] = s;
166 | }
167 | 
168 | static float get_pixel(image m, int x, int y, int c)
169 | {
170 |     assert(x < m.w && y < m.h && c < m.c);
171 |     return m.data[c*m.h*m.w + y*m.w + x];
172 | }
173 | 
174 | static void set_pixel(image m, int x, int y, int c, float val)
175 | {
176 |     if (x < 0 || y < 0 || c < 0 || x >= m.w || y >= m.h || c >= m.c) return;
177 |     assert(x < m.w && y < m.h && c < m.c);
178 |     m.data[c*m.h*m.w + y*m.w + x] = val;
179 | }
180 | 
181 | static void add_pixel(image m, int x, int y, int c, float val)
182 | {
183 |     assert(x < m.w && y < m.h && c < m.c);
184 |     m.data[c*m.h*m.w + y*m.w + x] += val;
185 | }
186 | 
187 | void embed_image(image source, image dest, int dx, int dy)
188 | {
189 |     int x,y,k;
190 |     for(k = 0; k < source.c; ++k){
191 |         for(y = 0; y < source.h; ++y){
192 |             for(x = 0; x < source.w; ++x){
193 |                 float val = get_pixel(source, x,y,k);
194 |                 set_pixel(dest, dx+x, dy+y, k, val);
195 |             }
196 |         }
197 |     }
198 | }
199 | 
200 | 
201 | image letterbox_image(image im, int w, int h)
202 | {
203 |     int new_w = im.w;
204 |     int new_h = im.h;
205 |     if (((float)w/im.w) < ((float)h/im.h)) {
206 |         new_w = w;
207 |         new_h = (im.h * w)/im.w;
208 |     } else {
209 |         new_h = h;
210 |         new_w = (im.w * h)/im.h;
211 |     }
212 |     image resized = resize_image(im, new_w, new_h);
213 |     image boxed = make_image(w, h, im.c);
214 |     fill_image(boxed, .5);
215 |     //int i;
216 |     //for(i = 0; i < boxed.w*boxed.h*boxed.c; ++i) boxed.data[i] = 0;
217 |     embed_image(resized, boxed, (w-new_w)/2, (h-new_h)/2);
218 |     free_image(resized);
219 |     return boxed;
220 | }
221 | 


--------------------------------------------------------------------------------
/src/image.h:
--------------------------------------------------------------------------------
 1 | /*
 2 |  * Company:	Synthesis
 3 |  * Author: 	Chen
 4 |  * Date:	2018/06/07
 5 |  */
 6 | #ifndef __IMAGE_H_
 7 | #define __IMAGE_H_
 8 | 
 9 | typedef struct
10 | {
11 |     int w;
12 |     int h;
13 |     int c;
14 |     float *data;
15 | }image;
16 | 
17 | image make_image(int w, int h, int c);
18 | 
19 | image make_empty_image(int w, int h, int c);
20 | 
21 | 
22 | image load_image_color(char* filename,int w,int h);
23 | 
24 | void free_image(image m);
25 | 
26 | image letterbox_image(image im, int w, int h);
27 | 
28 | static float get_pixel(image m, int x, int y, int c);
29 | 
30 | static void set_pixel(image m, int x, int y, int c, float val);
31 | 
32 | static void add_pixel(image m, int x, int y, int c, float val);
33 | 
34 | #endif
35 | 


--------------------------------------------------------------------------------
/src/image_opencv.cpp:
--------------------------------------------------------------------------------
 1 | /*
 2 |  * Company:	Synthesis
 3 |  * Author: 	Chen
 4 |  * Date:	2020/04/26	
 5 |  */
 6 |  #include "image_opencv.h"
 7 | image mat_to_image(cv::Mat mat)
 8 | {
 9 |     int w = mat.cols;
10 |     int h = mat.rows;
11 |     int c = mat.channels();
12 |     image im = make_image(w, h, c);
13 |     unsigned char *data = (unsigned char *)mat.data;
14 |     int step = mat.step;
15 |     for (int y = 0; y < h; ++y) {
16 |         for (int k = 0; k < c; ++k) {
17 |             for (int x = 0; x < w; ++x) {
18 |                 //uint8_t val = mat.ptr<uint8_t>(y)[c * x + k];
19 |                 //uint8_t val = mat.at<Vec3b>(y, x).val[k];
20 |                 //im.data[k*w*h + y*w + x] = val / 255.0f;
21 | 
22 |                 im.data[k*w*h + y*w + x] = data[y*step + x*c + k] / 255.0f;
23 |             }
24 |         }
25 |     }
26 |     return im;
27 | }
28 | 
29 | 
30 | cv::Mat image_to_mat(image im)
31 | {
32 |     int channels = im.c;
33 |     int width = im.w;
34 |     int height = im.h;
35 |     cv::Mat mat = cv::Mat(height, width, CV_8UC(channels));
36 |     int step = mat.step;
37 | 
38 |     for (int y = 0; y < im.h; ++y) {
39 |         for (int x = 0; x < im.w; ++x) {
40 |             for (int c = 0; c < im.c; ++c) {
41 |                 float val = im.data[c*im.h*im.w + y*im.w + x];
42 |                 mat.data[y*step + x*im.c + c] = (unsigned char)(val * 255);
43 |             }
44 |         }
45 |     }
46 |     return mat;
47 | }


--------------------------------------------------------------------------------
/src/image_opencv.h:
--------------------------------------------------------------------------------
 1 | /*
 2 |  * Company:	Synthesis
 3 |  * Author: 	Chen
 4 |  * Date:	2020/04/26	
 5 |  */
 6 | 
 7 |  #ifndef __IMAGE_OPENCV_H_
 8 | #define __IMAGE_OPENCV_H_
 9 | 
10 | #include <opencv2/opencv.hpp>
11 | #include "image.h"
12 | 
13 | image mat_to_image(cv::Mat mat);
14 | 
15 | cv::Mat image_to_mat(image im);
16 | 
17 | #endif


--------------------------------------------------------------------------------
/src/yolo_layer.cpp:
--------------------------------------------------------------------------------
  1 | /*
  2 |  * Company:	Synthesis
  3 |  * Author: 	Chen
  4 |  * Date:	2018/06/04
  5 |  */
  6 | 
  7 | #include "yolo_layer.h"
  8 | #include "blas.h"
  9 | #include "cuda.h"
 10 | #include "activations.h"
 11 | #include "box.h"
 12 | #include <stdio.h>
 13 | #include <math.h>
 14 | 
 15 | //yolov3
 16 | //float biases[18] = {10,13,16,30,33,23,30,61,62,45,59,119,116,90,156,198,373,326};
 17 | 
 18 | //yolov4
 19 | float biases[18] = {12, 16, 19, 36, 40, 28, 36, 75, 76, 55, 72, 146, 142, 110, 192, 243, 459, 401};
 20 | 
 21 | //yolov3-tiny
 22 | float biases_tiny[12] = {10,14,23,27,37,58,81,82,135,169,344,319};
 23 | 
 24 | layer make_yolo_layer(int batch,int w,int h,int net_w,int net_h,int n,int total,int classes)
 25 | {
 26 |     layer l = {0};
 27 |     l.n = n;
 28 |     l.total = total;
 29 |     l.batch = batch;
 30 |     l.h = h;
 31 |     l.w = w;
 32 |     l.c = n*(classes+ 4 + 1);
 33 |     l.out_w = l.w;
 34 |     l.out_h = l.h;
 35 |     l.out_c = l.c;
 36 |     l.classes = classes;
 37 |     l.inputs = l.w*l.h*l.c;
 38 | 
 39 |     l.biases = (float*)calloc(total*2,sizeof(float));
 40 | 
 41 |     l.mask = (int*)calloc(n,sizeof(int));
 42 |     if(9 == total){
 43 |         for(int i =0;i<total*2;++i){
 44 |             l.biases[i] = biases[i];
 45 |         }
 46 |         if(l.w == net_w / 32){
 47 |             int j = 6;
 48 |             for(int i =0;i<l.n;++i)
 49 |                 l.mask[i] = j++;
 50 |         }
 51 |         if(l.w == net_w / 16){
 52 |             int j = 3;
 53 |             for(int i =0;i<l.n;++i)
 54 |                 l.mask[i] = j++;
 55 |         }
 56 |         if(l.w == net_w / 8){
 57 |             int j = 0;
 58 |             for(int i =0;i<l.n;++i)
 59 |                 l.mask[i] = j++;
 60 |         }
 61 |     }
 62 | 
 63 |     if(6 == total){
 64 |         for(int i =0;i<total*2;++i){
 65 |             l.biases[i] = biases_tiny[i];
 66 |         }
 67 |         if(l.w == net_w / 32){
 68 |             int j = 3;
 69 |             for(int i =0;i<l.n;++i)
 70 |                 l.mask[i] = j++;
 71 |         }
 72 |         if(l.w == net_w / 16){
 73 |             int j = 0;
 74 |             for(int i =0;i<l.n;++i)
 75 |                 l.mask[i] = j++;
 76 |         }
 77 |     }
 78 |     l.outputs = l.inputs;
 79 |     l.output = (float*)calloc(batch*l.outputs,sizeof(float));
 80 |     l.output_gpu = cuda_make_array(l.output,batch*l.outputs);
 81 |     
 82 |     return l;
 83 | }
 84 | 
 85 | void free_yolo_layer(layer l)
 86 | {
 87 |     if(NULL != l.biases){
 88 |         free(l.biases);
 89 |         l.biases = NULL;
 90 |     }
 91 | 
 92 |     if(NULL != l.mask){
 93 |         free(l.mask);
 94 |         l.mask = NULL;
 95 |     }
 96 |     if(NULL != l.output){
 97 |         free(l.output);
 98 |         l.output = NULL;
 99 |     }
100 | 
101 |     if(NULL != l.output_gpu)
102 |         cuda_free(l.output_gpu);
103 | }
104 | 
105 | static int entry_index(layer l,int batch,int location,int entry)
106 | {
107 |     int n = location / (l.w*l.h);
108 |     int loc = location % (l.w*l.h);
109 |     return batch*l.outputs + n*l.w*l.h*(4 + l.classes + 1) + entry*l.w*l.h + loc;
110 |  }
111 | 
112 | void forward_yolo_layer_gpu(const float* input,layer l)
113 | {
114 |     copy_gpu(l.batch*l.inputs,(float*)input,1,l.output_gpu,1);
115 |     int b,n;
116 |     for(b = 0;b < l.batch;++b){
117 |   	for(n =0;n< l.n;++n){
118 | 	    int index = entry_index(l,b,n*l.w*l.h,0);
119 |             activate_array_gpu(l.output_gpu + index, 2*l.w*l.h,LOGISTIC);
120 |             index = entry_index(l,b,n*l.w*l.h,4);
121 |             activate_array_gpu(l.output_gpu + index,(1 + l.classes)*l.w*l.h,LOGISTIC);
122 | 	}
123 |     }
124 |     cuda_pull_array(l.output_gpu,l.output,l.batch*l.outputs);
125 | }
126 | 
127 | 
128 | 
129 | int yolo_num_detections(layer l,float thresh)
130 | {
131 |     int i,n,b;
132 |     int count = 0;
133 |     for(b = 0;b < l.batch;++b){
134 |         for(i=0;i<l.w*l.h;++i){
135 |             for(n=0;n<l.n;++n){
136 |                 int obj_index = entry_index(l,b,n*l.w*l.h+i,4);
137 |                 if(l.output[obj_index] > thresh)
138 |                     ++count;
139 |             }
140 |         }
141 |     }
142 |     return count;
143 | }
144 | 
145 | int num_detections(std::vector<layer> layers_params,float thresh)
146 | {
147 |     int i;
148 |     int s=0;
149 |     for(i=0;i<layers_params.size();++i){
150 |         layer l  = layers_params[i];
151 |         s += yolo_num_detections(l,thresh);
152 |     }
153 |     return s;
154 | 
155 | }
156 | 
157 | detection* make_network_boxes(std::vector<layer> layers_params,float thresh,int* num)
158 | {
159 |     layer l = layers_params[0];
160 |     int i;
161 |     int nboxes = num_detections(layers_params,thresh);
162 |     if(num) *num = nboxes;
163 |     detection *dets = (detection*)calloc(nboxes,sizeof(detection));
164 |     for(i=0;i<nboxes;++i){
165 |         dets[i].prob = (float*)calloc(l.classes,sizeof(float));
166 |         //if(l.coords > 4)
167 |         //{
168 |         //    dets[i].mask = (float*)(l.coords-4,sizeof(float));
169 |         //}
170 |     }
171 |     return dets;
172 | }
173 | 
174 | 
175 | void correct_yolo_boxes(detection* dets,int n,int w,int h,int netw,int neth,int relative)
176 | {
177 |     int i;
178 |     int new_w=0;
179 |     int new_h=0;
180 |     if (((float)netw/w) < ((float)neth/h)){
181 |         new_w = netw;
182 |         new_h = (h * netw)/w;
183 |     }
184 |     else{
185 |         new_h = neth;
186 |         new_w = (w * neth)/h;
187 |     }
188 |     for (i = 0; i < n; ++i){
189 |         box b = dets[i].bbox;
190 |         b.x =  (b.x - (netw - new_w)/2./netw) / ((float)new_w/netw);
191 |         b.y =  (b.y - (neth - new_h)/2./neth) / ((float)new_h/neth);
192 |         b.w *= (float)netw/new_w;
193 |         b.h *= (float)neth/new_h;
194 |         if(!relative){
195 |             b.x *= w;
196 |             b.w *= w;
197 |             b.y *= h;
198 |             b.h *= h;
199 |         }
200 |         dets[i].bbox = b;
201 |     }
202 | }
203 | 
204 | 
205 | box get_yolo_box(float* x,float* biases,int n,int index,int i,int j,int lw, int lh,int w, int h,int stride)
206 | {
207 |     box b;
208 |     b.x = (i + x[index + 0*stride]) / lw;
209 |     b.y = (j + x[index + 1*stride]) / lh;
210 |     b.w = exp(x[index + 2*stride]) * biases[2*n] / w;
211 |     b.h = exp(x[index + 3*stride]) * biases[2*n + 1] / h;
212 |     return b;
213 | }
214 | 
215 | 
216 | int get_yolo_detections(layer l,int w, int h, int netw,int neth,float thresh,int *map,int relative,detection *dets)
217 | {
218 |     int i,j,n,b;
219 |     float* predictions = l.output;
220 |     int count = 0;
221 |   for(b = 0;b < l.batch;++b){
222 |     for(i=0;i<l.w*l.h;++i){
223 |         int row = i/l.w;
224 |         int col = i%l.w;
225 |         for(n = 0;n<l.n;++n){           
226 |             int obj_index = entry_index(l,b,n*l.w*l.h + i,4);
227 |             float objectness = predictions[obj_index];
228 |             if(objectness <= thresh) continue;
229 |             int box_index = entry_index(l,b,n*l.w*l.h + i,0);
230 | 
231 |             dets[count].bbox = get_yolo_box(predictions,l.biases,l.mask[n],box_index,col,row,l.w,l.h,netw,neth,l.w*l.h);
232 |             dets[count].objectness = objectness;
233 |             dets[count].classes = l.classes;
234 |             for(j=0;j<l.classes;++j){
235 |                 int class_index = entry_index(l,b,n*l.w*l.h+i,4+1+j);
236 |                 float prob = objectness*predictions[class_index];
237 |                 dets[count].prob[j] = (prob > thresh) ? prob : 0;
238 |             }
239 |             ++count;
240 |         }
241 |     }
242 |   }
243 |     correct_yolo_boxes(dets,count,w,h,netw,neth,relative);
244 |     return count;
245 | }
246 | 
247 | 
248 | void fill_network_boxes(std::vector<layer> layers_params,int img_w,int img_h,int net_w,int net_h,float thresh, float hier, int *map,int relative,detection *dets)
249 | {
250 |     int j;
251 |     for(j=0;j<layers_params.size();++j){
252 |         layer l = layers_params[j];
253 |         int count = get_yolo_detections(l,img_w,img_h,net_w,net_h,thresh,map,relative,dets);
254 |         dets += count;
255 |     }
256 | }
257 | 
258 | 
259 | detection* get_network_boxes(vector<layer> layers_params,
260 |                              int img_w,int img_h,int net_w,int net_h,float thresh,float hier,int* map,int relative,int *num)
261 | {
262 |     //make network boxes
263 |     detection *dets = make_network_boxes(layers_params,thresh,num);
264 | 
265 |     //fill network boxes
266 |     fill_network_boxes(layers_params,img_w,img_h,net_w,net_h,thresh,hier,map,relative,dets);
267 |     return dets;
268 | }
269 | 
270 | //get detection result
271 | detection* get_detections(std::vector<Blob<float>*> blobs,int img_w,int img_h,int net_w,int net_h, float thresh, int classes, int *nboxes)
272 | {
273 |     std::vector<layer> layers_params;
274 |     layers_params.clear();
275 |     for(int i=0;i<blobs.size();++i){
276 |         layer l_params;
277 |         l_params = make_yolo_layer(blobs[i]->num(),blobs[i]->width(),blobs[i]->height(),net_w,net_h,num_bboxes,blobs.size()*dev_num_anchors,classes);
278 |         layers_params.push_back(l_params);
279 |         forward_yolo_layer_gpu(blobs[i]->gpu_data(),l_params);
280 |     }
281 |     
282 |     //get network boxes
283 |     detection* dets = get_network_boxes(layers_params,img_w,img_h,net_w,net_h,thresh,hier_thresh,0,relative,nboxes);
284 | 
285 |     //release layer memory
286 |     for(int index =0;index < layers_params.size();++index){
287 |         free_yolo_layer(layers_params[index]);
288 |     }
289 | 
290 |     //do nms
291 |     if(nms_thresh) do_nms_sort(dets,(*nboxes),classes,nms_thresh);
292 | 
293 |     return dets;       
294 | }
295 | 
296 | 
297 | //release detection memory
298 | void free_detections(detection *dets,int nboxes)
299 | {
300 |     int i;
301 |     for(i = 0;i<nboxes;++i){
302 |         free(dets[i].prob);
303 |     }
304 |     free(dets);
305 | }
306 | 


--------------------------------------------------------------------------------
/src/yolo_layer.h:
--------------------------------------------------------------------------------
 1 | /*
 2 |  * Company:	Synthesis
 3 |  * Author: 	Chen
 4 |  * Date:	2018/06/04	
 5 |  */
 6 | 
 7 | #ifndef __YOLO_LAYER_H_
 8 | #define __YOLO_LAYER_H_
 9 | #include <caffe/caffe.hpp>
10 | #include <string>
11 | #include <vector>
12 | 
13 | using namespace caffe;
14 | 
15 | 
16 | // const int classes = 80;
17 | // const float thresh = 0.5;
18 | const float hier_thresh = 0.5;
19 | const float nms_thresh = 0.45;
20 | const int num_bboxes = 3;
21 | const int relative = 1;
22 | 
23 | const int dev_num_anchors = 3;
24 | 
25 | typedef struct{
26 |     float x,y,w,h;
27 | }box;
28 | 
29 | typedef struct{
30 |     box bbox;
31 |     int classes;
32 |     float* prob;
33 |     float* mask;
34 |     float objectness;
35 |     int sort_class;
36 | }detection;
37 | 
38 | typedef struct layer{
39 |     int batch;
40 |     int total;
41 |     int n,c,h,w;
42 |     int out_n,out_c,out_h,out_w;
43 |     int classes;
44 |     int inputs,outputs;
45 |     int *mask;
46 |     float* biases;
47 |     float* output;
48 |     float* output_gpu;
49 | }layer;
50 | 
51 | layer make_yolo_layer(int batch,int w,int h,int n,int total,int classes);
52 | 
53 | void free_yolo_layer(layer l);
54 | 
55 | void forward_yolo_layer_gpu(const float* input,layer l, float* output);
56 | 
57 | detection* get_detections(std::vector<Blob<float>*> blobs,int img_w,int img_h,int net_w,int net_h,float thresh, int classes, int* nboxes);
58 | 
59 | void free_detections(detection *dets,int nboxes);
60 | 
61 | 
62 | 
63 | 
64 | #endif
65 | 


--------------------------------------------------------------------------------