我有一个具有以下结构的文件:
finance
www.lemonde.fr 4
|
Brexit:
www.lemonde.fr 2
|
divorce
www.lemonde.fr 2
www.lequipe.fr 8
|
amiable
www.lemonde.fr 2
|
rupture
www.lemonde.fr 2
www.leparisien.com 3
www.lequipe.fr 2
|
Economie
www.lemonde.fr 1
|
Entreprises
www.lemonde.fr 2
www.laposte.fr/particulier 1
|
xiti
www.laposte.fr/particulier 1
|
该文件实际上要大得多,这些是最后几行。
我的目标是将此文件加载到哈希表中。
关键字将是每个块的第一个单词。
该值将是此结构的指针:
typedef struct wordInfo {
char **urls_list;
int *nbOccurence;
int size;
} wordInfo;
主功能 :
int main(){
GHashTable *hash = loadIndex("index.txt");
printf("Nombre de clé dans la table: %d\n", g_hash_table_size(hash));
g_hash_table_foreach(hash, (GHFunc)iterator, "Cle: %s, Value: %p\n");
wordInfo* x = g_hash_table_lookup(hash, "xiti");
if(x == NULL){
printf("NULL\n");
}
printf("Taille: %d",x->size);
for(int i = 0 ; i < x->size ; i++){
printf("Lien: %s\n", (x->urls_list)[i]);
}
g_hash_table_destroy(hash);
return 0;
}
加载文件的函数loadIndex():
GHashTable* loadIndex(char *filename){
FILE *f=fopen(filename,"r");
GHashTable* hash = g_hash_table_new(g_str_hash, g_str_equal);
char *word=malloc(100);
while(fgets(word,100,f)!=NULL) { // reading a word
char *aux=strchr(word,'\n'); // removes the trailing \n
aux[0]='\0';
// we make a structure for the wod we just found
wordInfo *x = g_malloc(sizeof(wordInfo));
x->urls_list = malloc(sizeof(char)*100);
x->size = 0;
x->nbOccurence = malloc(sizeof(int)*100);
char *line = malloc(100);
while(fgets(line,100,f)!=NULL){ //read urls for the found word
if(!strcmp(line,"|\n")){ // until we find character |
break;
}
char *url = strtok(line," ");
char *occ = strtok(NULL," ");
x->urls_list[x->size] = malloc(strlen(url));
strcat(x->urls_list[x->size],url);
x->nbOccurence[x->size] = atoi(occ);
x->size += 1;
}
char* key;
key = g_strdup(word);
g_hash_table_insert(hash, key ,(wordInfo*)x);
}
return hash;
}
foreach输出为:
Cle: xiti, Value: 0x978b40
Cle: xiti, Value: 0x687e60
Cle: xiti, Value: 0xb23830
Cle: xiti, Value: 0x86b1f0
Cle: xiti, Value: 0x81e890
Cle: xiti, Value: 0x9df7c0
Cle: xiti, Value: 0x6b0330
Cle: xiti, Value: 0x9eef10
如您所见,我没有不同的单词作为键,而只有文件中的最后一个。此外,我也不明白我如何可以多次拥有相同的键,难道它不应该包含唯一的键吗?
最佳答案
我找到了解决方案:我不得不使用g_strdup来制作密钥,将char *添加为密钥是行不通的。我编辑了代码
关于c - Glib HashTable无法正确插入,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/43560132/