通过观察RDD.scala源代码即可知道cache和persist的区别:
     
    
| 
          
          
          
          
          | 
     
     
    
     
     
    
     
     
    
     
     
    
     
     
    
     
     
    
     
     
    
     
     
    
     
     
    
     
     
    
     
     
    
     
      可知:
     
    
     
      
       
        1)RDD的cache()方法其实调用的就是persist方法,缓存策略均为MEMORY_ONLY;
       
      
     
    
     
      
       
        2)可以通过persist方法手工设定StorageLevel来满足工程需要的存储级别;
       
      
     
    
     
      
       
        3)cache或者persist并不是action;
       
      
     
    
     
     
    
     
     
    
     
     
    
     
     
    
 
