Tag: ocr
如何识别高级的验证码
admin | 取词 | 2014-01-22
一、验证码的基本知识
1. 验证码的主要目的是强制人机交互来抵御机器自动化攻击的。
2. 大部分的验证码设计者并不得要领,不了解图像处理,机器视觉,模式识别,人工智能的基本概念。
3. 利用验证码,可以发财,当然要犯罪:比如招商银行密码只有6位,验证码形同虚设,计算机很快就能破解一个有钱的账户,很多帐户是可以网上交易的。
4. 也有设计的比较... [阅读全文]
tesseract OCR锻炼新字体对图片的预处理和要求
admin | 取词 | 2014-01-22
tesseract OCR训练新字体对图片的预处理和要求
同tesseract OCR识别对图片有要求一样,在训练新的字符集或新的字体时,对图片也有一定要求,符合要求的图片,能大大提高训练的效率。
在图像处理方面,去除噪声,使训练的字符图片尽量连贯、清晰。
其他方面,通常的要求如下:
1. 在一幅图片内,字体统一,决不能将多种字体混合出现在一幅训练图片内;如... [阅读全文]
HBITMAP 灰度
admin | win32 | 2014-01-21
C++
//灰度处理
#define GET_GRAY_VALUE(x) 0.110*GetBValue(x)+0.588*GetGValue(x)+0.302*GetRValue(x)
HBITMAP CCatchScreenDlg::GetGrayBitmap( HBITMAP hResBitmap ,int& nWhiteCount,int& nBackCount )
{
nWhiteCount=0;
nBackCount=0;
ASSERT(hResBitmap);
HBITMAP hDesBitmap=NULL;
BITMAP bm;
... [阅读全文]
write DIB
admin | win32 | 2014-01-21
C++
static BOOL WriteDIB( LPCTSTR szFile, HANDLE hDIB)
{
BITMAPFILEHEADER hdr;
LPBITMAPINFOHEADER lpbi;
if (!hDIB)
return FALSE;
CFile file;
if( !file.Open (szFile, CFile::modeWrite | CFile::modeCreate))
{
return FALSE;
}
lpbi = (LPBITMAPINFOHEADER) hDIB;
int nColors = 1... [阅读全文]
DDB To DIB
admin | 取词 | 2014-01-21
C++
HANDLE CGraphView::DDBToDIB( CBitmap& bitmap, DWORD dwCompression )
{
BITMAP bm;
BITMAPINFOHEADER bi;
LPBITMAPINFOHEADER lpbi;
DWORD dwLen;
HANDLE hDIB;
HANDLE handle;
HDC ... [阅读全文]
tesscallback.h(1011): error C2872: “remove_reference”: 不明确的符号
admin | 取词 | 2014-01-20
真正原因查明:\tesseract-ocr\include\tesseract\tesscallback.h(1011): error C2872: “remove_reference”: 不明确的符号。 引发的真正元凶是
#include “baseapi.h” 与
using namespace std;
在源码文件中出现顺序的问题,先 #include “baseapi.h” 后
using namespace std; 则OK, 如此可以避免名字的冲突!!!
[阅读全文]
Capture2Text
admin | 屏幕取词 | 2013-04-19
Capture2Text
Contents
What is Capture2Text?
Download
How to Install
OCR
Speech Recognition
Output Options
Configuration
Substitutions
Command Line Options
What is Capture2Text?
Capture2Text enables users to do the following:
Optical Character Recognition (OCR) Allows the user to quickly snapshot a small portion of the scr... [阅读全文]
Tesseract OCR开源项目
admin | 屏幕取词 | 2013-04-18
最近,项目中需要使用基于图像识别验证码的技术,初步探索尝试了一下开源的Tesseract OCR项目。该项目简介如下:
This package contains the Tesseract Open Source OCR Engine. Orignally developed at Hewlett Packard Laboratories Bristol and at Hewlett Packard Co, Greeley Colorado.
The Tesseract OCR engine was one of the top 3 engines in... [阅读全文]