字符串查找

最近需要改進(jìn)一個(gè)字符串查找的算法展氓。
我用了類似于KMP的算法穆趴。相比于一個(gè)一個(gè)比較。效率提高大概25倍

代碼

#include <stdio.h>
#include <time.h>
const int maxNum = 1005;



char* genRandomString(int length)  
{  
    int flag, i;  
    char* string; 
    srand((unsigned) time(NULL ));  
    if ((string = (char*) malloc(length)) == NULL )  
    {  
        printf("Malloc failed!flag:14\n");  
        return NULL ;  
    }  
  
    for (i = 0; i < length - 1; i++)  
    {  
        flag = rand() % 3;  
        switch (flag)  
        {  
            case 0:  
                string[i] = 'A' + (rand() + length) % 26;  
                break;  
            case 1:  
                string[i] = 'a' + rand() % 26;  
                break;  
            case 2:  
                string[i] = '0' + (rand() + length) % 10;  
                break;  
            default:  
                string[i] = 'x';  
                break;  
        }  
    }  
    string[length - 1] = '\0';  
    return string;  
}

char* getString(char* src, int length)  
{  
    int flag, i;  
    char* string; 
    srand((unsigned) time(NULL ));  
    if ((string = (char*) malloc(length)) == NULL )  
    {  
        printf("Malloc failed!flag:14\n");  
        return NULL ;  
    }  
  
    int srcLen = strlen(src);
    int startNum =  rand() % (srcLen - length);
    
    memcpy(string , *(src + startNum) , length);
    string[length - 1] = '\0';  
    return string;  
}

int Sunday(char * sr, int srclen, char * ta, int targetlen)
{
    int shift[maxNum];
    int i = 0;
    char* src = sr;
    char* target = ta;
    // 默認(rèn)值遇汞,移動(dòng)m+1位
    for( i = 0; i < maxNum; i++) {
        shift[i] = targetlen + 1;
    }
    for( i = 0; i < targetlen; i++) {
        shift[target[i]] = targetlen - i;
    }

    // 模式串開始位置在主串的哪里
    int s = 0;
    // 模式串已經(jīng)匹配到的位置
    int j;
    while(s <= srclen - targetlen) {
        j = 0;
        while(src[s + j] == target[j]) {
            j++;
            // 匹配成功
            if(j >= targetlen) {
                return s;
            }
        }
        s += shift[src[s + targetlen]];
    }
    return -1;
}

int atoi(char *s)
{
    int i = 0;
    int n = 0;
    for (i = 0; *s >= '0'&& *s <= '9' ; ++i)
    {
        n = 10 * n + (*s - '0');
    }
    return n;
}


int myMemmem(char * a, int alen, char * b, int blen)
{
    int i =0;
    int j =0;
    for ( i = 0; i <= (alen - blen); ++i)
    {
        for (j = 0; j < blen; ++ j)
        {
            if (a[i + j] != b[j])
            {
                break;
            }
        }
        if (j >= blen)
        {
            return i;
        }
    }
    return -1;
 }
/**
IN
at the thought of
though

OUT
7
**/
int main() {
    // 主串和模式串
    char* T;
    char* P;
    int a = 0;
    int b = 0;
    clock_t start;
    clock_t finish;
    double  duration;

    while(1) {
        // 獲取一行
        printf("put T length\n");
        scanf("%d",&a);
        printf("put P length\n");
        scanf("%d",&b);
        
        T = genRandomString(a);
        P = genRandomString(b);
        // printf("--------------T = (%s)\n", T);
        // printf("--------------P = (%s)\n", P);
        start = clock(); 
        int res = Sunday(T, a-1, P, b-1);
        finish = clock(); 
        duration = (double)(finish - start) / CLOCKS_PER_SEC;  
        printf( "--Sunday time is %f seconds\n", duration );      
        if(res == -1) {
            printf("Sunday主串和模式串不匹配\n");
        } else {
            printf("Sunday模式串在主串的位置為:%d\n", res);
        }

        start = clock(); 
        res = myMemmem(T, a-1, P, b-1);
        finish = clock(); 
        duration = (double)(finish - start) / CLOCKS_PER_SEC;  
        printf( "--myMemmem time is %f seconds\n", duration ); 

        if(res == -1) {
            printf("myMemmem主串和模式串不匹配\n");
        } else {
            printf("myMemmem模式串在主串的位置為:%d\n", res);
        }
    free(T);
    free(P);
    }
    return 0;
}

后續(xù)
新的版本的memmem函數(shù)用的是高效率的算法未妹,比KMP的快。

代碼如下

/* Copyright (C) 1991-2013 Free Software Foundation, Inc.
   This file is part of the GNU C Library.
   The GNU C Library is free software; you can redistribute it and/or
   modify it under the terms of the GNU Lesser General Public
   License as published by the Free Software Foundation; either
   version 2.1 of the License, or (at your option) any later version.
   The GNU C Library is distributed in the hope that it will be useful,
   but WITHOUT ANY WARRANTY; without even the implied warranty of
   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
   Lesser General Public License for more details.
   You should have received a copy of the GNU Lesser General Public
   License along with the GNU C Library; if not, see
   <http://www.gnu.org/licenses/>.  */

/* This particular implementation was written by Eric Blake, 2008.  */

#ifndef _LIBC
# include <config.h>
#endif

/* Specification of memmem.  */
#include <string.h>

#ifndef _LIBC
# define __builtin_expect(expr, val)   (expr)
#endif

#define RETURN_TYPE void *
#define AVAILABLE(h, h_l, j, n_l) ((j) <= (h_l) - (n_l))
#include "str-two-way.h"

#undef memmem

/* Return the first occurrence of NEEDLE in HAYSTACK.  Return HAYSTACK
   if NEEDLE_LEN is 0, otherwise NULL if NEEDLE is not found in
   HAYSTACK.  */
void *
memmem (const void *haystack_start, size_t haystack_len,
    const void *needle_start, size_t needle_len)
{
  /* Abstract memory is considered to be an array of 'unsigned char' values,
     not an array of 'char' values.  See ISO C 99 section 6.2.6.1.  */
  const unsigned char *haystack = (const unsigned char *) haystack_start;
  const unsigned char *needle = (const unsigned char *) needle_start;

  if (needle_len == 0)
    /* The first occurrence of the empty string is deemed to occur at
       the beginning of the string.  */
    return (void *) haystack;

  /* Sanity check, otherwise the loop might search through the whole
     memory.  */
  if (__builtin_expect (haystack_len < needle_len, 0))
    return NULL;

  /* Use optimizations in memchr when possible, to reduce the search
     size of haystack using a linear algorithm with a smaller
     coefficient.  However, avoid memchr for long needles, since we
     can often achieve sublinear performance.  */
  if (needle_len < LONG_NEEDLE_THRESHOLD)
    {
      haystack = memchr (haystack, *needle, haystack_len);
      if (!haystack || __builtin_expect (needle_len == 1, 0))
    return (void *) haystack;
      haystack_len -= haystack - (const unsigned char *) haystack_start;
      if (haystack_len < needle_len)
    return NULL;
      return two_way_short_needle (haystack, haystack_len, needle, needle_len);
    }
  else
    return two_way_long_needle (haystack, haystack_len, needle, needle_len);
}
libc_hidden_def (memmem)

#undef LONG_NEEDLE_THRESHOLD

這個(gè)memmem函數(shù)用的是two_way_long_needle 的算法空入。已經(jīng)是比較快的算法了络它。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市歪赢,隨后出現(xiàn)的幾起案子化戳,更是在濱河造成了極大的恐慌,老刑警劉巖轨淌,帶你破解...
    沈念sama閱讀 216,324評(píng)論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件迂烁,死亡現(xiàn)場離奇詭異,居然都是意外死亡递鹉,警方通過查閱死者的電腦和手機(jī)盟步,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,356評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來躏结,“玉大人却盘,你說我怎么就攤上這事∠彼” “怎么了黄橘?”我有些...
    開封第一講書人閱讀 162,328評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長屈溉。 經(jīng)常有香客問我塞关,道長,這世上最難降的妖魔是什么子巾? 我笑而不...
    開封第一講書人閱讀 58,147評(píng)論 1 292
  • 正文 為了忘掉前任帆赢,我火速辦了婚禮,結(jié)果婚禮上线梗,老公的妹妹穿的比我還像新娘椰于。我一直安慰自己,他們只是感情好仪搔,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,160評(píng)論 6 388
  • 文/花漫 我一把揭開白布瘾婿。 她就那樣靜靜地躺著,像睡著了一般烤咧。 火紅的嫁衣襯著肌膚如雪偏陪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,115評(píng)論 1 296
  • 那天煮嫌,我揣著相機(jī)與錄音竹挡,去河邊找鬼。 笑死立膛,一個(gè)胖子當(dāng)著我的面吹牛揪罕,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播宝泵,決...
    沈念sama閱讀 40,025評(píng)論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼好啰,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了儿奶?” 一聲冷哼從身側(cè)響起框往,我...
    開封第一講書人閱讀 38,867評(píng)論 0 274
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎闯捎,沒想到半個(gè)月后椰弊,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體许溅,經(jīng)...
    沈念sama閱讀 45,307評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,528評(píng)論 2 332
  • 正文 我和宋清朗相戀三年秉版,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了贤重。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,688評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡清焕,死狀恐怖并蝗,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情秸妥,我是刑警寧澤滚停,帶...
    沈念sama閱讀 35,409評(píng)論 5 343
  • 正文 年R本政府宣布,位于F島的核電站粥惧,受9級(jí)特大地震影響键畴,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜突雪,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,001評(píng)論 3 325
  • 文/蒙蒙 一镰吵、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧挂签,春花似錦疤祭、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,657評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至侨核,卻和暖如春草穆,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背搓译。 一陣腳步聲響...
    開封第一講書人閱讀 32,811評(píng)論 1 268
  • 我被黑心中介騙來泰國打工悲柱, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人些己。 一個(gè)月前我還...
    沈念sama閱讀 47,685評(píng)論 2 368
  • 正文 我出身青樓豌鸡,卻偏偏與公主長得像,于是被迫代替她去往敵國和親段标。 傳聞我的和親對(duì)象是個(gè)殘疾皇子涯冠,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,573評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容

  • 一.順序查找 1.1 思路:這是最簡單的算法,從頭開始遍歷每個(gè)元素逼庞,并將每個(gè)元素與查找元素比較蛇更,如果一致則返回。1...
    deffing閱讀 1,193評(píng)論 0 1
  • Boyer-Moore字符串查找算法當(dāng)可以在文本字符串中回退時(shí),如果可以從左向右掃描模式字符串并將它和文本匹配派任,那...
    sleepyjoker閱讀 383評(píng)論 0 0
  • 字符串查找通常有四種方式砸逊,暴力查找,KMP查找掌逛,BoyerMoore查找以及RabinKarp算法查找师逸,查找最簡單...
    FlyElephant閱讀 2,798評(píng)論 0 0
  • 子字符串的一種基本操作就是子字符串查找:給定一段長度為N的文本和一個(gè)長度為M的模式字符串,在文本中找到一個(gè)和該模式...
    sleepyjoker閱讀 1,508評(píng)論 0 0
  • 我是日記星球138號(hào)星寶寶小萱我正在參加日記星球第四期蛻變之旅,這是我的第33篇原創(chuàng)日記拍柒。 小時(shí)候最大的夢想就是有...
    譞言閱讀 274評(píng)論 9 7