[比赛总结] Kaggle-Carvana 银牌

发表于 2017-10-13 | 分类于深度学习 | | 阅读次数

前言

暑假从华为实习结束之后到国庆前这一个多月的时间基本都是在打Kaggle上的Carvana这个比赛，主要做的是车辆与背景的分割，数据集比较简单，都是同一场景的图片，所以对模型的要求也不高，简单的模型就可以胜任。也因此，大家的榜上的成绩都刷得特别高。所以我在比赛前期基本都是在100~200名徘徊，到了后期才逐渐进入了前100。到比赛截止public leaderboard到达60名，private leaderboard到达33名(735队)，取得了银牌。最后的结果还是比较出乎我的意料的，从中还是学习到了许多东西的。

之所以参加这次比赛，也跟这个比赛很像我之前看的那两篇关于肺部分割的论文ChestX-ray8以及SCAN有关。如果之后继续研究相关课题，相信这次比赛的经验也可以帮助我更好地入手该课题的研究。

阅读全文 »

[论文笔记] SCAN

发表于 2017-08-09 | 分类于深度学习 | | 阅读次数

Introduction

Title: Structure Correcting Adversarial Network for Organ Segmentation in Chest X-rays
Author: Wei Dai, Joseph Doyle, Xiaodan Liang, Hao Zhang, Nanqing Dong, Yuan Li, Eric P. Xing Petuum Inc.
arXiv: https://arxiv.org/abs/1703.08770

本文主要是一篇关于对双肺和心脏进行语义分割的论文，作者认为器官语义分割是针对胸片（CXR）构建计算机辅助诊断系统的重要一步，器官的区域提供了丰富的结构信息，可用于诊断许多病症。而目前胸片又因辐射小、花费低，而十分普遍，给放射科工作者带来了巨大的工作量。所以本文的研究具有现实意义。同时该研究也存在着巨大的挑战，CXR为2d灰度图片，且目前公开数据集数据量很少（多只有几百张），无法直接应用在大规模数据集上训练好的网络模型。作者据此提出了SCAN框架，该模型采用了GAN（生成对抗网络）的思想，包含了一个分割网络(segmentation network)和一个判别网络(critic network)，采用零和博弈的思想，在公开数据集JSRT和Montgomery上进行单独交替训练。这两个网络都是一个复杂的神经网络，包含FCN、和VGG-based（VGG基础上进行修改）、残差块(residual block)。这是一个数据依赖性小（不依赖大规模数据）、参数量小的模型，取得了一个高准确率（人类专家水平）、高效率（<1s）、迁移性强（泛化能力强）的结果，超过该研究领域的state-of-the-art Registration-based approach。

Keyword

Adversarial Network（对抗网络）
- critic network（判别网络）
- segmentaiton network（分割网络）
Organ Segmentation（器官图像分割）
Chest X-rays (CXR)
Structure Correcting（通过critic network 获取 Global structure information 全局结构信息）
FCN + GAN

阅读全文 »

[论文笔记] ChestX-ray8

发表于 2017-08-02 | 分类于深度学习 | | 阅读次数

Introduction

Title: ChestX-ray8: Hospital-scale Chest X-ray Database and Benchmarks（标杆） on
Weakly-Supervised（弱监督） Classiﬁcation and Localization of Common Thorax（胸部） Diseases

Author: Xiaosong Wang, Yifan Peng, Le Lu, Zhiyong Lu, Mohammadhadi Bagheri, Ronald M. Summers

arXiv: https://arxiv.org/abs/1705.02315

本文主要是一篇关于胸部X光片的诊断和病理位置定位的论文，作者分析了当前医学图像在深度学习领域的应用仍然存在着数据的稀缺性，以及对标记数据的依赖性。作者旨在构建大规模高准确率的计算机辅助诊断系统，希望引起学术界能对构建大规模医学图像数据库的兴趣。作者通过自然语言处理(NLP)方法从医院PACS系统中，提取报告内容，获取标签，构建了一套医院规模的胸片数据库，主要包含了8种胸部疾病和正常样例，由十万张胸片构成（相比于其他成果，这个数据集已经算比较大的了）。作者又在这个数据集的基础上，通过设计了一套统一DCNN的训练框架，适用于不同的pre-trained model，完成病理识别，证明了能通过弱监督学习完成病理位置的空间定位，减少了对专业的病理位置标记图像的依赖性。是该研究方向的一个benchmark。

Keyword

Weakly-Supervised（弱监督）
Multi-labels Classification（多标签分类）
Localization（定位）
Hospital-scale Chest X-ray Database（医院规模X光胸片数据库）
Commn Thorax Diseases（常见胸部疾病）
NLP（自然语言处理）

弱监督：没有基于像素标记的训练图像，只有基于图像类别标签的图像， image-level class labels only。

Main Work

构建了一个新的弱监督多标签医学图像数据集数据集ChestX-ray8，比以往做研究的样本量要大。（亮点）
证明了在弱监督多标签图像的情况下，还可以判断和空间定位常见的胸部疾病。（亮点）
未来目标：构建全自动的“reading chest X-rays” 系统
PS: 介绍可围绕chestX-ray8和判断定位方法两个方面来介绍

阅读全文 »

Caffe 入门

发表于 2017-07-30 | 分类于深度学习 | | 阅读次数

导语

在目前学术界中，使用Caffe来做计算机视觉方面的，还是比较主流的。我一开始对Caffe的了解还是只停留下跑过caffe的代码，用caffe进行过训练，但是自己对其各个依赖包和原理还不是特比了解，主要就参考赵永科的《深度学习：21天实战caffe》这本书来了解一下caffe的原理，并整理下笔记。主要看了他介绍caffe各个依赖包和架构的部分，书本大概有一半的内容贴的是caffe的源码以及作者的注释，整体来说只能说是比较适合入门者，适合刚刚接触caffe框架的人快速了解整体的框架。

想要了解Caffe入门使用，如何使用caffe在猫狗分类的数据集上进行训练可以参考我的GitHub：caffe-beginner

PS: 此处未包含Caffe依赖包安装，默认服务器已经安装，详细可以参考Caffe官网查看更多安装细节。

阅读全文 »

Kaggle: Planet Competion Record

发表于 2017-06-26 | 分类于深度学习 | | 阅读次数

概述

比赛信息：

Name: Planet: Understanding the Amazon from Space.
*Goal: *Use satellite data to track the human footprint in the Amazon rainforest
Kaggle 比赛地址: https://www.kaggle.com/c/planet-understanding-the-amazon-from-space
个人GitHub仓库（存放相关代码）:https://github.com/Kinpzz/Kaggle-Planet-Competition

主要工作

进行亚马逊热带雨林卫星图像的分类，其中每张图片可能包含多个标签

进度

Previous work

May 30th 使用单个vgg16、ResNet提交baseline，发现存在问题

weeks

Day 1, June 26th Mon. 完成数据集分析
Day 2, June 27th Tue. 完成天气分类训练
Day 3, June 28th Wed. 完成校验集划分输出F beta score观察，完成陆地类训练，观察各类精度
Day 4, June 29th Thurs. 完成阈值搜索，完成初次提交和改进，成绩LB 0.91816
Day 5, June 30th Fri. 对LB 0.91816预测结果进行分析，发现问题，尝试改进
Day 6, July 3th Mon. 改用Inception v3模型，使用Keras进行修改和fine-tune
Day 7, July 4th Tue. 使用旋转、对称方法预处理图像，增加训练样本
Day 8, July 5th, Wed. 考试，剩余时间在训练Inception v3 模型 (LB 0.91815)
Day 9, July 6th Thurs. 使用投票的方法，将不同方法预处理的结果进行投票综合, 准备答辩

阅读全文 »

Jenkins + Docker 项目持续部署实践

发表于 2017-06-08 | 分类于开发 | | 阅读次数

前言

在博客Docker 入门 & CI/CD实践中，提及到了如何搭建Jenkins来进行持续集成和持续部署，并且跑了对大作业的web后端进行了一个简单的demo，使用自动触发抓取GitHub上项目代码进行持续集成测试，通过了mvn clean test的构建测试。本文将进一步通过Jenkins和docker对整个“订你所想”订票系统的Web Service Server、Web Page Server、Database server 等进行持续集成和持续部署。

PS: 本文的自动部署方法可能仍然存在一些问题，因为这系列的docker集群存在着一定的依赖关系，单独自动部署某个容器过程如果某个失败，可能会破坏其他容器的依赖关系，所以后续会再改用docker compose 对docker container集群进行部署的改进，使用docker compose可以实现集群依赖关系的先后部署和统一管理。

阅读全文 »

连接mysql远程服务器

发表于 2017-06-04 | 分类于开发 | | 阅读次数

前言

在电影售票系统的大作业中，我们将web，后台，数据库都部署在阿里云的服务器上。首先我们需要从服务器获取数据库的电影、影院等数据，这里就先记录下如何在云服务器上创建一个数据库，并允许远程访问。这里所使用的是阿里云服务器，系统为Ubuntu 16.04 LTS

阅读全文 »

Docker 入门 & CI/CD实践

发表于 2017-05-16 | 分类于服务器 | | 阅读次数

导语

现在很火的一个技术就是云计算服务，除了很早就开始做云计算的Amazon，阿里、腾讯、京东、百度等巨头也分分加入云计算的领域中。谈到云计算，就离不开Docker这个方便的工具啦。正如Docker的slogan所说”Build, Ship, and Run Any App, Anywhere”，它通过对应用组件的封装（Packaging）、分发（Distribution）、部署（Deployment）、运行（Runtime）等生命周期的管理，达到应用组件级别的”一次封装，到处运行”。

今天我就来学习一下什么是Docker，以及如何在阿里云服务器上用Docker上进行持续集成/持续部署(CI/CD)的，并把学习和实践的过程整理记录下来，其中某些概念性的知识可能会直接摘录官方文档或者相关教程，希望在自己之后的项目之中，可以派的上用场。

如果你已经熟悉了Docker，并会使用它了，那么请直接跳到本文的后半部分 CI/CD on Docker

阅读全文 »

Face Morphing 人脸融合

发表于 2017-04-25 | 分类于计算机视觉 | | 阅读次数

导语

效果

下面是一段面部合成的过程，演示了从一张脸过渡到另一张脸的过程。

其实实现的原理很简单，就是对两张图片每个像素点按一定的比例进行混合。通过以下的公式来对每个像素点进行融合。

$$ M(x,y) = (1-\alpha)I(x,y) + \alpha J(x,y)$$

其中α代表了图片J所占比重。但是，如果对两张图片进行融合的话会出现一个问题，就是五官的位置并没有对齐，会出现奇怪的效果，如下图参考1中所展示的图片的问题。会发现效果并不是很好，只是两张图片单纯的叠加。

这次实验的主要内容，就是介绍如何进行比较和谐的一种融合效果，已经将多张不同比重融合的图片所组成的一个人脸变换过程。

阅读全文 »

ssh config配置

发表于 2017-04-15 | | 阅读次数

最近实训的实验室使用了一批新的服务器，给成员分了一张1080 GTX的显卡来进行深度学习训练。单机有4张卡，4个人一组，每人使用一张。服务器一般都没有图形化界面。加上自己之前所使用的digitalocean和阿里云的云服务器，自己有了比较多的服务器要进行连接。如果每次都使用ssh user@hostname -i id_rsa来指定私钥与服务器上的公钥进行连接太过麻烦了，以及在后面会经常使用到scp每次都要指定私钥或者输入用户密码也比较麻烦，所以这里就记录一下如何配置ssh config来方便我们管理多个ssh连接。

阅读全文 »

Paul Kinpzz

Computer Vision & Deep Learning

GitHub 知乎