简短版本:如何将具有最小冲突的任意字符串转换为6位数字?

长版:

我正在与一个小型图书馆合作,该图书馆有一堆没有ISBN的书籍。这些通常是较旧的,绝大部分发行商发行的绝版出版物,从未开始使用ISBN,我想为他们生成伪造的ISBN,以帮助条形码扫描和借阅。

从技术上讲,真正的ISBN由商业实体控​​制,但是可以使用这种格式来分配不属于真正的发布者的编号(因此不应引起任何冲突)。

格式如下:

978-0-01-######-?

给您6位数字,从000000到999999,并带有?最后是校验和。

在这种方案中,是否可以将任意书名转换为6位数字,并且发生冲突的可能性很小?

最佳答案

在为making a fixed-length hash使用代码段并计算了ISBN-13 checksum之后,我设法创建了看起来很丑陋的C#代码。它将使用任意字符串并将其转换为有效(但为假)的ISBN-13:

       public int GetStableHash(string s)
       {
           uint hash = 0;
           // if you care this can be done much faster with unsafe
           // using fixed char* reinterpreted as a byte*
           foreach (byte b in System.Text.Encoding.Unicode.GetBytes(s))
           {
               hash += b;
               hash += (hash << 10);
               hash ^= (hash >> 6);
           }
           // final avalanche
           hash += (hash << 3);
           hash ^= (hash >> 11);
           hash += (hash << 15);
           // helpfully we only want positive integer < MUST_BE_LESS_THAN
           // so simple truncate cast is ok if not perfect
           return (int)(hash % MUST_BE_LESS_THAN);
       }

       public int CalculateChecksumDigit(ulong n)
       {
           string sTemp = n.ToString();
           int iSum = 0;
           int iDigit = 0;

           // Calculate the checksum digit here.
           for (int i = sTemp.Length; i >= 1; i--)
           {
               iDigit = Convert.ToInt32(sTemp.Substring(i - 1, 1));
               // This appears to be backwards but the
               // EAN-13 checksum must be calculated
               // this way to be compatible with UPC-A.
               if (i % 2 == 0)
               { // odd
                   iSum += iDigit * 3;
               }
               else
               { // even
                   iSum += iDigit * 1;
               }
           }
           return (10 - (iSum % 10)) % 10;
       }


       private void generateISBN()
       {
           string titlehash = GetStableHash(BookTitle.Text).ToString("D6");
           string fakeisbn = "978001" + titlehash;
           string check = CalculateChecksumDigit(Convert.ToUInt64(fakeisbn)).ToString();

            SixDigitID.Text = fakeisbn + check;
       }

关于string - 根据书名生成伪造的ISBN? (或: How to hash a string into a 6-digit numeric ID),我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/12834771/

10-15 05:54