我想遍历2个集合,每个集合大约有600条记录。我想将集合1的每个元素与集合2中的所有其他元素进行比较。如果我选择我的集合为LinkedHashSet,那么我必须在每个集合上调用迭代器,并且有两个while(内部和外部)循环。
对于ArrayList的选择,我将有两个for循环(内部和外部)从每个集合读取数据。

最初,我选择LinkedHashSet是因为我了解到LinkedHashSet具有更好的性能,我也更喜欢使用set来删除重复项,但是在看到它运行非常缓慢之后(大约需要2个小时才能完成),我认为将set复制到ArrayList,然后遍历ArrayList而不是LinkedHashSet。
我想知道哪一个有更好的选择来加快运行时间。

公共ArrayList> processDataSourcesV2(LinkedHashMap> ppmsFinalResult,LinkedHashMap> productDBFinalResult){
      //每个参数是一个包含键(id)和值(唯一参数集)的哈希映射
      ArrayList> result = new ArrayList>();

  Iterator<Entry<RecordId, LinkedHashSet<String>>> ppmsIterator = ppmsFinalResult.entrySet().iterator();
  Iterator<Entry<RecordId, LinkedHashSet<String>>> productIdIterator =null;
  //pair of id from each list
  ArrayList<Pair> listOfIdPair = new ArrayList<Pair>();
  while (ppmsIterator.hasNext()) {
      //RecordId object is an object containing the id and which list this id belongs to
      Entry<RecordId, LinkedHashSet<String>> currentPpmsPair = ppmsIterator.next();
      RecordId currentPpmsIDObj = currentPpmsPair.getKey();
      //set of unique string
      LinkedHashSet<String> currentPpmsCleanedTerms = (LinkedHashSet<String>)currentPpmsPair.getValue();
      productIdIterator = productDBFinalResult.entrySet().iterator();

      while (productIdIterator.hasNext()) {

          Entry<RecordId, LinkedHashSet<String>> currentProductDBPair = productIdIterator.next();
          RecordId currentProductIDObj = currentProductDBPair.getKey();
          LinkedHashSet<String> currentProductCleanedTerms = (LinkedHashSet<String>)currentProductDBPair.getValue();
          ArrayList<Object> listOfRowByRowProcess = new ArrayList <Object>();
          Pair currentIDPair = new Pair(currentPpmsIDObj.getIdValue(),currentProductIDObj.getIdValue());
          //check for duplicates
          if ((currentPpmsIDObj.getIdValue()).equals(currentProductIDObj.getIdValue()) || listOfIdPair.contains(currentIDPair.reverse()) ) {
              continue;
          }
          else {
              LinkedHashSet<String> commonTerms = getCommonTerms(currentPpmsCleanedTerms,currentProductCleanedTerms);
              listOfIdPair.add(currentIDPair.reverse());
              if (commonTerms.size()>0) {
                  listOfRowByRowProcess.add(currentPpmsIDObj);
                  listOfRowByRowProcess.add(currentProductIDObj);
                  listOfRowByRowProcess.add(commonTerms);

                  result.add(listOfRowByRowProcess);
              }
          }

      }


  }

  return result;
}



 public LinkedHashSet<String> getCommonTerms(LinkedHashSet<String> setOne, LinkedHashSet<String> setTwo){
     Iterator<String> setOneIt = setOne.iterator();
     LinkedHashSet<String> setOfCommon = new LinkedHashSet<String>();
     //making hard copy
     while (setOneIt.hasNext()) {
         setOfCommon.add(setOneIt.next());
     }
     setOfCommon.retainAll(setTwo);
     return setOfCommon;
 }

最佳答案

数组在迭代方面比任何其他结构都要快(所有元素都顺序存储在内存中),另一方面,在删除和插入元素时,数组要慢一些,因为它必须确保顺序存储。在链表上进行迭代的速度较慢,因为您可能会遇到页面错误的情况。因此,由您决定选择哪一个。

关于java - 通过LinkedHashSet进行的迭代是否比通过ArrayList进行的迭代更快?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/47932855/

10-12 12:54
查看更多